美国经济学家发现了一个很奇特的“裙子理论”:当大街上女人的裙子由长开始变短时,往往意味着一轮牛市的来临;当短得不能再短时,往往牛市已经走到了最后的疯狂;当女人们的裙子由短开始变长时,那您就得千万小心一轮熊市也许将要发生。同样有人用Twitter做了个研究,说如果Twitter上快乐的言语比较多,那么股市上涨概率比较高。
我的想法比较简单,是一个股市晴雨表的概念。现实中如果大家都在讨论股市,那么可能预示这这是一个牛市;若在熊市中,大家的讨论趋近冷淡,那么可能预示即将见底。庆幸有微博这种东西,可以利用微博的搜索功能研究一下微博话题和股市的关系,编制一种“人气指数”,看看如何从技术上实现和从方法上完善:
首先,在微博里对相关关键词进行搜索
接着,以时间为横轴,微博条数为纵轴画出图表
最后,将同时期的股价图形叠加上去
以下是几点补充说明:
- 从第二个图可以看到,微博条数大幅增加。主要原因是新浪网本身的增长。2011的中期报告显示,6月新浪微博的用户数环比增长了43%。如何排除该因素的影响?但曲线的增长开始变缓,微博可能已经进入了成熟期,该因素影响可能减弱,未来一年的结果可能会比较好。此外,是否可以直接过滤掉用户数增长的影响?
- 可能是由于新浪和博主自己的删帖等原因,即时统计和若干月之后的历史统计会不一致。因此最好能够每天统计,将数据静态化。这也是为什么要在现在就提出这个想法而不是等一年后稳定之后再做的原因。
- 推荐数据库中存储每日的微博量,分析时使用周平均数据。
- 未来扩展方向:
a) 基础理论上的统计和相关性分析
b) 从大盘拓展到个股
c) 自定义关键词(组),关键词的可靠性
发表回复