用于决策的情感分析
1. 情感分析基础与相关算法
在情感分析中,超平面所在区域的判定是一个重要问题。根据相关公式,对于一个文件(记为 (d_j)),(c_j \in { -1, 1}) 会根据(正、负)进行划分。向量 (\vec{w}) 的数学表达式为:
[
\vec{w} = \sum_{j} a_j c_j \vec{d_j}, \quad a_j \geq 0
]
其中,对偶优化问题可得出 (a_j) 的值。当 (\vec{d_j}) 和 (a_j) 都大于 0 时,它们被定义为支持向量,这不仅因为它们基于文档,还因为它们对 (\vec{w}) 有贡献。
研究表明,带有局部权重的朴素贝叶斯算法在性能上优于普通朴素贝叶斯算法和 k - 近邻(kNN)算法。并且,与通过放宽朴素贝叶斯内在独立性假设来改进它的更复杂方法相比,它也表现出色。局部加权学习仅假设在邻域内具有独立性,而不像标准朴素贝叶斯算法那样假设在整个实例空间中都具有全局独立性。
2. 数据实验设置
2.1 数据集获取
使用从 www.movielens.org 检索到的 MovieLens 数据集,该数据集包含 100,004 条评分和 1,296 个标签,涉及 9,125 部电影。数据评论由 671 名用户在 1995 年 1 月至 2016 年 10 月期间撰写,所有用户都被纳入分析。筛选标准要求用户至少对 20 部电影进行了标记,所有用户通过唯一 ID 识别,无更多人口统计信息。
2.2 特征选择
在特征选择方面,采用 K - 均值分类器,而非其他传统方法。期望通过可验证和可评估的
情感分析在决策中的应用与评估
超级会员免费看
订阅专栏 解锁全文
4078

被折叠的 条评论
为什么被折叠?



