推特推文人格预测与深度学习框架下的音乐情绪疗法
一、推特推文人格预测
1.1 多分类与二分类模型精度对比
在人格预测方面,基于推特推文构建了多种分类模型,其精度表现如下表所示:
|序号|模型|准确率|
|----|----|----|
|1|基础模型|0.405|
|2|全数据集平衡 - 词频向量器|0.772|
|3|全数据集平衡 - TF - IDF|0.857|
|4|单独训练集平衡 - 词频向量器|0.443|
|5|单独训练集平衡 - TF - IDF|0.466|
对于二分类(拆分)模型,具体情况如下:
|序号|模型|准确率|
|----|----|----|
|1|组合朴素贝叶斯模型|0.717|
|2|组合平衡朴素贝叶斯模型|0.704|
从这些数据可以看出,不同的模型在准确率上存在较大差异。全数据集平衡的 TF - IDF 模型准确率最高,达到了 0.857。而在二分类模型中,组合平衡朴素贝叶斯模型虽然准确率相较于组合朴素贝叶斯模型略有下降,但仍可用于人格预测。
1.2 模型选择与结论
在二分类模型中,平衡后的模型准确率为 0.704,相较于不平衡数据模型准确率仅下降了 1%,虽存在轻微过拟合,但仍适合用于人格预测。因此,选择组合平衡朴素贝叶斯模型来预测新用户数据。
研究表明,使用 SMOTE 和随机欠采样技术平衡数据集能显著提高模型的准确率,但平衡整个数据集可能会导致模型过拟合,所以应在相关数据上进行平衡操作以获得更好的结果。结合预处理的朴素贝叶斯分类器模型在预测
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



