互联网搜索数据与股票市场及Web服务发现研究
互联网搜索数据与股票市场关系研究
在研究互联网搜索数据与股票市场的关系时,数据处理是重要的第一步。
- 数据来源与转换
- 搜索数据 :源于Google insights,提供特定时间范围内关键词的标准化搜索,标准化搜索数据反映了关键词在Google上的受关注程度,即搜索关注度。
- 股票数据 :来自Wind咨询金融数据库,研究样本为2004年1月至2009年11月上海综合指数(代码:000001)的收盘价。
- 数据转换公式 :
- 股票年收益率:$y_t = 100 * \ln(P_t / P_{t - 12})$,其中$y_t$是时间$t$的收益率,$P_t$是时间$t$的收盘价。
- 搜索年变化率:$x_t = 100 * \ln(S_t / S_{t - 12})$,其中$x_t$是时间$t$的变化率,$S_t$是时间$t$的搜索关注度。
- 关键词选择与时差测量
- 依据股票交易过程的影响因素选择了131个相关关键词。
- 为每个关键词附加两个参数:领先阶数和相关性。领先阶数大于0表示领先关系;等于0表示同步关系;小于0表示滞后关系。相关性表示搜索关注度曲线变化率与股票收益率曲线的相似程度,相关性越高,两者越相似。
- 关键词指数构成
- 学术界设置权重有两种方法:系统评估法和根据相关性赋权法。
- 本研究将两种方法结合
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



