利用推特情感分析检测股市操纵及专利文本自动分割
在金融和知识产权领域,数据的分析和处理对于做出准确决策至关重要。本文将介绍利用推特情感分析检测股市操纵的方法,以及专利文本自动分割的相关技术。
一、利用推特情感分析检测股市操纵
- 分类器选择与评估
- 分类器方法 :在使用支持向量机(SVM)进行情感分类时,有“一对多”(one - vs - all)和“一对一”(one - vs - one)两种方法。“一对多”方法将感兴趣的类的数据实例标记为正,其余标记为负,但在数据未聚类的情况下表现不佳,因为许多数据实例可能被预测为多个类的正例而无法分类。“一对一”方法则将数据实例归类到数据实例最多的类,对该问题不敏感,但对于类别较多的问题,类别数量会迅速增加。
- 分类器评估 :使用手动仔细标记的股票推文训练分类器,让未参与训练数据的人员标记测试数据集(包含1332条手动标记的股票推文)。采用5折交叉验证进行训练,即把数据采样成5份,4份用于训练,1份用于测试,重复5次并取平均性能结果。使用精确率、召回率和分类准确率作为性能指标评估分类器。精确率衡量分类的准确性,召回率衡量分类的完整性。
- 股票极性计算
- 情感预测 :使用基于标记股票推文训练的SVM分类器预测每条推文的情感(负、中性和正)。
- 极性计算 :根据负、中性和
超级会员免费看
订阅专栏 解锁全文
2296

被折叠的 条评论
为什么被折叠?



