互联网搜索数据与股票市场:关联分析与服务发现新方法
1. 互联网搜索数据与股票收益的关系研究
在研究互联网搜索数据与股票收益的关系时,数据来源和处理是基础。搜索数据来自 Google insights,它能提供特定时间范围内关键词的标准化搜索,这些标准化数据反映了关键词在 Google 上的受关注程度,即搜索关注度。而股票数据则源自 Wind 咨询金融数据库,研究样本选取了 2004 年 1 月至 2009 年 11 月上海综合指数(代码:000001)的收盘价。
数据转换公式如下:
- 股票年收益率:$y_t = 100 * \ln(P_t / P_{t - 12})$,其中$y_t$是时间$t$的收益率,$P_t$是时间$t$的收盘价。
- 搜索年变化率:$x_t = 100 * \ln(S_t / S_{t - 12})$,其中$x_t$是时间$t$的变化率,$S_t$是时间$t$的搜索关注度。
关键词的选择和时间差异测量也很关键。根据股票交易过程的影响因素,选取了 131 个相关关键词。为评估搜索关注度变化与股票收益的关系,为每个关键词附加了两个参数:领先阶数和相关性。领先阶数大于 0 表示领先关系,等于 0 表示同步关系,小于 0 表示滞后关系。相关性则代表搜索关注度曲线变化率与股票收益曲线的相似程度,相关性越高,两者越相似。
在关键词指数构建方面,学术界设置权重有两种方法:系统评估法和根据相关性赋权法。研究将这两种方法结合,把先行指标分为三类,构建了三种类型的指数:投资者行为指数、市场行情指数和宏观形势指数。
在实证分析阶段,选择上海综合指数年收益率$y$作为因变量,投资者行为指数$x_1$、市场行情指数$x_2$和宏
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



