垃圾邮件检测与新闻主题分类:从朴素贝叶斯到支持向量机
1. 朴素贝叶斯垃圾邮件检测
在垃圾邮件检测中,我们可以使用朴素贝叶斯分类器。以下是具体的操作步骤:
1. 获取预测概率 :使用 predict_proba 方法获取预测结果。
prediction_prob = clf.predict_proba(term_docs_test)
print(prediction_prob[0:10])
- 获取预测类别 :使用
predict方法直接获取预测的类别值,默认阈值为0.5。
prediction = clf.predict(term_docs_test)
print(prediction[:10])
- 评估准确性 :调用
score方法快速测量准确性。
accuracy = clf.score(term_docs_test, Y_test)
print('The accuracy using MultinomialNB is: {0:.1f}%'.format(accuracy*100))
从朴素贝叶斯到SVM的文本分类
超级会员免费看
订阅专栏 解锁全文
1325

被折叠的 条评论
为什么被折叠?



