现在主流的量化分析,是基于市场的交易数据训练模型,得到一个较好的拟合结果,但是中国的市场,很多时候是非理性的,噪声很多,导致在训练时得到一个较好的结果,但是实盘操作时,结果不如人意。这里我试试另辟蹊经,分析主流市场情绪来预判股价。
这个小项目,主要分三个步骤,第一部获取数据,第二部分析情感,第三部根据情感分析判断股票买入卖出。
关于第一步,数据是成功的最核心要素,找到真正能够反映市场情绪的数据,基本就成功一半了,所以我们抓取的数据,要有时效性,专业性,上一篇我们抓取了微博数据,那我们就从微博开始。
关于第二步,情感分析,这个涉及一个很复杂的模块,nlp自然语言处理,要想了解清楚,花费的力气太大,不用深入研究,有一些开源的nlp框架如SnowNLP等,效果的话需要一个较好的语料库,还有不断的调优。还有一种方式,就是使用大厂商的商业产品,如腾讯文智,提供免费试用!我想采用的就是第二种。
关于第三步,可以从财经网站抓取,获取使用一些第三方接口,python就有很多这样的库,如TuShare。