MOOC课程评论极性不一致:基于用户与情感分析方法的研究
1. 引言
情感分析(SA)近年来因网络和社交媒体的兴起而广受欢迎,它专注于分析人们对产品、服务、组织、问题或个人的态度,旨在开发计算机方法来识别情感并提取信息,辅助决策者。许多组织采用情感分析方法(SAMs)来改善决策,深入了解消费者行为和对业务或产品的看法。
大规模开放在线课程(MOOC)为学习者提供了全球优质学习资源。在线教育正从内容收集阶段向内容筛选阶段转变,学生渴望选择合适的课程,并在评论区分享观点。这些评价包含了重要反馈,了解学生对课程及其主要工具的看法对改进MOOC至关重要。
研究提出了两个问题:人们是否常在同一句子中使用冲突极性的表述?Coursera评论评分能否准确反映每个观点中句子的极性?为解决这些问题,研究人员从Kaggle网站收集了六个MOOC课程的76,382条学生评论,运用四种情感分析方法,研究其极性与用户评价的关联。
2. 文献综述
- Walsh的研究 :使用多种分类算法(如MaxEnt分类器、Naive Bayes分类器和Stanford分类器)分析斯坦福课程调查的观点,有助于教师、学生和管理人员对课程调查进行分组,了解学生对课程的感受。研究发现,Naive Bayes(NB)分类器中的一元模型表现较好,但某些情况下独立性假设会导致错误。
- Wen等人的研究 :提出在MOOC中进行综合情感调查,以了解学生对课程及其工具的看法。该研究可能揭示课程讨论中的情绪与学生退出数量之间的紧密联系,但需要完善的MOOC词典来改进策略。