A股微博人气指数

美国经济学家发现了一个很奇特的“裙子理论”:当大街上女人的裙子由长开始变短时,往往意味着一轮牛市的来临;当短得不能再短时,往往牛市已经走到了最后的疯狂;当女人们的裙子由短开始变长时,那您就得千万小心一轮熊市也许将要发生。同样有人用Twitter做了个研究,说如果Twitter上快乐的言语比较多,那么股市上涨概率比较高。

我的想法比较简单,是一个股市晴雨表的概念。现实中如果大家都在讨论股市,那么可能预示这这是一个牛市;若在熊市中,大家的讨论趋近冷淡,那么可能预示即将见底。庆幸有微博这种东西,可以利用微博的搜索功能研究一下微博话题和股市的关系,编制一种“人气指数”,看看如何从技术上实现和从方法上完善:

首先,在微博里对相关关键词进行搜索
searchresult

接着,以时间为横轴,微博条数为纵轴画出图表
chart1

最后,将同时期的股价图形叠加上去
chart2

以下是几点补充说明:

  1. 从第二个图可以看到,微博条数大幅增加。主要原因是新浪网本身的增长。2011的中期报告显示,6月新浪微博的用户数环比增长了43%。如何排除该因素的影响?但曲线的增长开始变缓,微博可能已经进入了成熟期,该因素影响可能减弱,未来一年的结果可能会比较好。此外,是否可以直接过滤掉用户数增长的影响?
  2. 可能是由于新浪和博主自己的删帖等原因,即时统计和若干月之后的历史统计会不一致。因此最好能够每天统计,将数据静态化。这也是为什么要在现在就提出这个想法而不是等一年后稳定之后再做的原因。
  3. 推荐数据库中存储每日的微博量,分析时使用周平均数据。
  4. 未来扩展方向:
    a) 基础理论上的统计和相关性分析
    b) 从大盘拓展到个股
    c) 自定义关键词(组),关键词的可靠性
    • 徐哥到此一游!
    • 2011/09/07

    微博的数据比股票市场晚点!如果反过来就好了!

    • 暴暴
    • 2011/09/07

    开开你太可爱了~
    1. 总结一下就是【微博指数】和【A股股价】的相关性分析,其中【微博指数】分为人气和关键词频率,【股价】分为大盘指数和相关各股。
    2. 理论层面:是市场有效性检验的一个侧面,大概可以参考相关的实证分析的paper
    3. 操作层面:a. 数据过滤,其实这就是做这个研究最难的事情,因为信息对股价的作用其实是多维交错的,因为每天的信息都非常多,微博人气反应出网民寄情娱乐的心态,微博人气是网民心态子集,网民心态是社会心态子集,投资者心态也是社会心态子集,而“【投资者心态】和【股价】的相关性研究”却反过来是“【微博指数】和【股价】的相关性研究”的子集。这个感觉应该参考行为金融学相关paper; 另外【微博人气】数据本身首先是去除新浪经营层面战略影响,这个要参考公司战略和内部数据才行,去除营销成果和行业生命周期发展;其次是要对人气这个原始数据做处理,比如换成每日增长率之类,还要做一阶差分之类的事情去除白噪声等随机误差 b. 事件研究,选取特殊的事件,建立观察窗口,比如股价剧烈异常波动的时候,看微博相关指数有没有提前或延后反应;或者反之。。不过我个人觉得这个概率不大,这个应该参考事件研究相关paper
    4. 总的来说我觉得相关性实证研究的相关paper应该不少的,看看牛人们的流程会学到狠多~~我是搓人我记忆力超差><~

    • ss
    • 2011/09/14

    -.-///

  1. 没有引用