基于机器学习算法的决策情感分析
1. 引言
自古以来,人们就对了解周围环境充满好奇。数据挖掘的出现带来了“意见挖掘”、情感分析(SA)等技术,这些技术提升了人们理解复杂文本环境的能力。在自然语言处理(NLP)领域,意见挖掘和SA指的是从书面文本中计算和识别意见、情感和主观性关键模式的算法。
技术的进步推动了SA技术的发展,使意见成为具有相关结构的一级属性。机器学习(ML)算法在不同的分类和预测任务中表现出色,包括文档分析。无论是监督学习还是无监督学习技术,经过适当改进和调整后,都可用于分析和整理文档及文本单元中的正负情感。监督学习和无监督学习都能检测情感评论的极性,但部署方式不同。例如,监督学习需要有训练子集,而无监督学习适用于有语言资源但缺少训练子集的数据集。
SA的基础假设是意见、态度和情感具有内在的二元对立,如喜欢或不喜欢、好或坏、积极或消极等。对这些情感的分析可使用NLP、统计或ML技术来刻画文本单元中的情感。SA的目的是从给定文本中提取特定内容,包括信息检索,即有效去除主观内容。一些SA任务还能识别和分离有意见倾向的查询。最重要的是,SA能总结多个观点,并就感兴趣的问题给出可操作的立场。
SA技术在商业智能和行业间业务运营中具有重要应用。在商业智能中,SA技术可用于搜索与感兴趣产品相关的意见。从共识角度获取的价格和客户满意度信息有助于获得准确信息,而无需订阅服务或创建个人资料,这也是SA与其他数据挖掘技术的显著区别。大多数关于SA的学术文章在文档层面应用了不同算法,且多以评论形式区分文本中的正负情感。目前NLP的发展带来了更多功能,包括支持多视角文档的句子级分析。
SA是一个具有三个不同层次的分类过程:
-
超级会员免费看
订阅专栏 解锁全文
1680

被折叠的 条评论
为什么被折叠?



