互联网搜索数据与股票市场及Web服务发现的研究
1. 互联网搜索数据与股票市场关系
1.1 数据来源与处理
- 数据来源 :搜索数据来自Google Insights,它提供特定时间范围内关键词的标准化搜索,标准化搜索数据反映了关键词在Google上的关注度,即搜索关注度。股票数据来自万得咨询金融数据库,研究样本为2004年1月至2009年11月上证综指(代码:000001)的收盘价。
- 数据转换
- 股票年收益率:$y_t = 100 * \ln(P_t / P_{t - 12})$,其中$y_t$是时间$t$的收益率,$P_t$是时间$t$的收盘价。
- 搜索年变化率:$x_t = 100 * \ln(S_t / S_{t - 12})$,其中$x_t$是时间$t$的变化率,$S_t$是时间$t$的搜索关注度。
1.2 关键词选择与时差测量
- 关键词选择 :根据股票交易过程的影响因素,选择了131个相关关键词。
- 参数设置 :为每个关键词附加两个参数,即领先阶数和相关性。领先阶数大于0表示领先关系;等于0表示同步关系;小于0表示滞后关系。相关性表示搜索关注度曲线变化率与股票收益率曲线的相似程度,相关性越高,两者越相似。
1.3 关键词指数构成
学术界设置权重有两种方法,一种是系统评估法
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



