基于情感分析的电影评论决策研究
1. 情感分析基础与相关算法
在情感分析中,超平面所在区域的判断至关重要。对于文件 (d_j),根据公式 (w = \sum_{j} a_j c_j d_j)(其中 (a_j \geq 0))来确定 (w) 的数学表述,这里 (c_j \in {-1, 1}) 按照(正,负)进行划分。对偶优化问题为 (a_j) 提供了值,那些 (d_j) 和 (a_j) 大于零的被定义为支持向量,它们不仅基于文档,还对 (w) 有贡献。
有研究表明,带有局部加权的朴素贝叶斯算法性能优于朴素贝叶斯本身和 (k) 近邻算法(kNN)。局部加权学习仅假设在邻域内独立,而非像标准朴素贝叶斯那样在整个实例空间全局独立。
2. 实验设置
2.1 数据集介绍
使用从 www.movielens.org 获取的 MovieLens 数据集,该数据集包含 9125 部电影的 100004 条评分和 1296 个标签。数据评论由 671 名用户在 1995 年 1 月至 2016 年 10 月期间撰写,分析中纳入了所有用户,但筛选标准要求用户至少对 20 部电影进行了评论,且用户通过唯一 ID 识别,无更多人口统计信息。
数据集包含链接、电影、标签和标签文件,每个文件包含特定信息。在特征选择方面,使用 K - means 分类器替代其他传统方法,期望通过可验证和可评估的算法预测标签,即具有相同品味的用户通常会对电影给出高相关性的评分。
2.2 数据准备和模型初始化
贝叶斯网络分类器训练数据所需时间短,且仅需最小度量来估计分类所需的必要因素。其条件概率简单,假设可靠,在多个领
超级会员免费看
订阅专栏 解锁全文
1453

被折叠的 条评论
为什么被折叠?



