机器学习是将数据转化为决策面的过程
scikit-learn缩写为sklearn
sklearn.naive_bayes.GaussianNB
训练一个分类器,学习之后预测其处理的准确性:
def NBAccuracy(features_train, labels_train, features_test, labels_test):
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
clf.fit(features_train, labels_train)
pred = clf.predict(features_test)
# labels_test的标签是我们之前就打好的,所以可以预测准确性
accuracy = clf.score(features_test, labels_test)
return accuracy
贝叶斯规则
事实上,贝叶斯更像是这样的一种表示
朴素贝叶斯用于判断文本中是否有哪个关键字有很强的优势,然而却不能用于判断句子顺序。用改模型可以判断作者写作风格,进而判断邮件作者是谁。