利用机器学习算法进行决策的情感分析
1. 引言
自古以来,人们就对了解周围环境充满好奇。数据挖掘的出现带来了“意见挖掘”、情感分析(SA)等技术,这些技术提升了人们理解复杂文本情境和环境的能力。在自然语言处理(NLP)领域,意见挖掘和SA指的是从书面文本中计算和识别意见、情感和主观性关键模式的算法。
技术的进步和SA技术的发展,使意见成为具有相关结构的一级属性。机器学习(ML)算法在不同的分类和预测任务中表现高效,包括文档分析。无论是监督学习还是无监督学习技术,经过适当改进和修改,都可用于分析和整理文档及文本单元中的正负情感。监督学习和无监督学习都能检测情感评论的极性,但部署方式不同。例如,监督学习仅在有训练子集时适用,而无监督学习适用于有语言资源但缺少训练子集的数据集。
SA基于这样的假设:意见、态度和情绪受具有内在二元对立的印象影响,意见通常表达为喜欢或不喜欢、好或坏、积极或消极等。对这些情感的分析可使用NLP、统计学或ML技术来刻画文本单元中的情感。SA的目的是从给定文本中提取特定内容,包括信息检索,即有效丢弃主观内容。一些SA任务还能识别和分离倾向于意见的查询。最重要的是,SA能总结多个观点,并就感兴趣的问题给出可操作的立场。
SA技术在商业智能和行业间业务运营中具有应用价值。在商业智能中,SA技术允许搜索与感兴趣产品相关的意见。从共识角度获取的价格和客户满意度信息,有助于在不订阅服务或创建个人资料的情况下获得准确信息,这也是SA与其他数据挖掘技术的显著区别。大多关于SA的学术文章在文档层面应用了不同算法,且多数文章以评论形式区分文本中的正负情感。目前NLP的发展带来了更多功能,包括支持多视角文档的句子级分析。
SA是一个具有三个不
超级会员免费看
订阅专栏 解锁全文
2140

被折叠的 条评论
为什么被折叠?



