- 量化投资:MATLAB数据挖掘技术与实践(第2版)
- 卓金武
- 830字
- 2025-02-27 14:07:43
6.4 应用实例:行业关联选股法
在股市中有一种按照行业选股的投资策略,其基本思想基于这样的认识:从众多个股中选择具有增长潜力的个股难度较大,但行业数较少,所以选对行业的可能性更高。另外,股市通常出现这样的现象,就是同行业的股票往往普涨或普跌,只要选对行业,无论怎么选个股,都可能盈利。这里,将介绍一种基于关联规则挖掘的选股方法——行业关联选股法。其基本思想是从数据中寻找关联的行业,当某个行业出现涨势之后,若其关联行业还没有开始涨,则从其关联行业中选择典型个股买入。
对于该方法,寻找关联行业是关键,而寻找关联行业,则正好可以用本章介绍的关联规则方法实现。
首先需要有行业关联数据的事务。在交易系统或公共股票数据中,能得到交易日各行业的涨幅数据,但这样的数据不能直接应用,需要对数据进行预处理。为此,需要定义一个标准,界定哪些行业算是涨势好的行业,比如可以定义10个交易日内,行业涨幅超过大盘涨幅5%的行业为好行业,这样就可以得到类似股市行业关联的事务数据,如表6-4所示。
表6-4 股市行业关联的事务矩阵

接下来,可以选择一种关联规则算法来挖掘这里的频繁项集。尽管Apriori算法有一些缺点,但该算法的适应性很强,所以这里依然用该算法实现关联行业的挖掘。将程序P6-1中的数据文件替换成表6-4中的数据文件,并设最小支持度为3,则很快可以得到如下结果。

由程序的执行结果可以看出,满足最小支持度3的包含3个行业项的项集只有一个,即
{银行,券商,钢铁:3/10}
上述说明这3个行业在一定周期内(10个交易日)具有较高(3/10)的联动可能性。
再看包含两个行业项的项集,即
{银行,钢铁:4/10}
{银行,券商:4/10}
而且它们联动的概率是一致的,都为4/10,所以在实践中,如果这3个行业中的一个出现涨势,那么就可以考虑从其他两个行业中选择代表性的股票买入,这样就可以在其他行业还没上涨的时候,以低价购入该行业股票,以此获得较高的收益。
上述就是行业关联选股法的基本思想、实现方式和操作步骤,当然这里介绍的案例只是一个原型,在具体操作中可以更灵活。