推特帖子英语、卡纳达语等语言的情感分析
1. 引言
推特是非常受欢迎的微博网站之一,用户可以自由创建和分享短消息,即“推文”。这些推文常被用于表达用户对政治、社会等不同话题的观点和评论。许多企业会在这些微博网站上投入大量资金,以与客户互动并了解他们对不同产品和服务的看法。情感分析在确定用户的情绪和态度方面起着重要作用。本文对推特推文进行情感分析,以判断推文是积极还是消极情感。
2. 相关工作
情感分析领域已有大量研究。推文的情感分析比传统文档更具挑战性,这不仅是因为使用了非正式语言,还因为大量使用了短俚语。现有研究主要集中在使用三种主要类型的特征:词汇、词性(POS)特征和微博特征。
- Pang和Lee :对之前的情感分析工作进行了最新调查。情感分析从文档级分类开始,然后发展到句子级,现在已进行到短语级。
- Bruns等人 :讨论了推特推文中的通信模式。
- Go等人 :在训练监督分类器(如朴素贝叶斯、最大熵和支持向量机)时,探索了结合不同n - 元特征和词性标签的方法。发现最大熵训练结合词性标签一元组可提高约3%的准确率,并且在n - 元组中添加词性标签特征可提高推文情感分类的准确性。
- Agarwal等人 :解释了词性特征、词汇特征和微博特征,并设计了推文的树状表示,将多种特征类别整合为一个简洁的表示。
- Feng和Barbosa :使用来自三个不同网站的极性预测作为噪声标签来训练模型,并手动标记了1000条推文进行进一步调整,
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



