深度学习在文本情感分析中的应用与未来趋势
1. 深度学习模型初步评估
1.1 Keras 分类器表现
使用 5000 个输入特征的初步 Keras 分类器表现良好,平均能够预测 Pitchfork 评论中对专辑的评价是“糟糕”“一般”“很棒”还是“惊人”,KerasClassifier 的平均得分达到 0.70533893018807。虽然 Scikit - Learn 分类器的平均得分略高,但使用 Keras 在 MacBook Pro 上利用所有可用核心进行训练仅需两小时,约为 Scikit - Learn MLPClassifier 训练时间的六分之一。这表明调整 Keras 模型(如添加更多隐藏层和节点、调整激活或成本函数、随机“丢弃”部分输入以避免过拟合等)能够更快速地改进模型。
1.2 数据集规模挑战
神经网络通常在其他机器学习模型之上表现出色,但这需要一定规模的训练数据。当前模型面临的主要挑战之一是数据集规模较小,只有当可用训练数据超过某个阈值时,神经网络才能充分发挥优势。
以下是相关代码:
cpath = '../review_corpus_proc'
mpath = {
'keras_model': 'keras_nn.h5',
'sklearn_pipe': 'pipeline.pkl'
}
scores = train_model(cpath, pipeline, saveto=mpath, cv=12)
超级会员免费看
订阅专栏 解锁全文
1046

被折叠的 条评论
为什么被折叠?



