利用大数据观点挖掘预测股票价格指数涨跌
1. 引言
随着信息通信技术(ICT)的发展、互联网的出现以及智能手机主导的移动环境的扩展,数字革命正在加速。日常和企业活动产生了大量的数字数据,近年来,这些大量数字数据的集合形式被称为“大数据”,人们对其利用产生了浓厚兴趣。
非结构化文本数据存在于各种内容形式中,如新闻文章、博客、社交网络服务(SNS)帖子、问答论坛和客户反馈等。本研究特别关注新闻文章中的数据,新闻媒体每天制作和数字化大量新闻文章并在全球分发。这些新闻文章影响社会各个领域,尤其与股票价格密切相关。虽然股票市场的变化不能仅由市场基本面的变化来解释,但新闻可能是一个重要因素。即使市场基本面没有明显变化,股票价格也可能因特定新闻的出现而波动。
然而,以往的研究主要针对特定事件或个别公司的新闻,难以将这些影响推广到现实世界中每天产生和分发的各种新闻。而且,新闻内容复杂,难以确定其对市场的实际因果影响以及这种影响是积极还是消极的。为了克服这些限制,本研究提出了基于观点挖掘的智能投资决策支持模型。
2. 相关工作
2.1 观点挖掘
观点挖掘是数据挖掘和计算语言学的一个子领域,用于提取、分类、理解和评估各种在线新闻来源、社交媒体评论和其他用户生成内容中表达的观点。“情感分析”常用于观点挖掘,以识别在线文本中的情感、情感倾向、主观性和其他情绪状态。
观点挖掘的工作包括自动挖掘电影评论并进行总结、提出使排名产品评论与搜索者意图对应的技术,以及利用Twitter监测的市场情绪预测股票价格走势等。为了更准确地提取文本中的观点和情感,构建观点挖掘的词汇表非常重要,考虑特定领域特征的情感词词典更有效。
超级会员免费看
订阅专栏 解锁全文
1731

被折叠的 条评论
为什么被折叠?



