分类算法的评价
1、分类准确度
对于极度偏斜的数据,只使用分类准确度是远远不够的
2、混淆矩阵
1、二分类问题
2、精准率
预测为1的事件,预测成功的概率
3、召回率
对于实际发生的事件1,预测成功的概率
4、精准率和召回率的意义
5、scikit-learn中的混淆矩阵、精准率、召回率In [8]: from sklearn.linear_model import LogisticRegression ...: ...: log_reg = LogisticRegression() ...: log_reg.fit(X_train,y_train) ...: log_reg.score(X_test,y_test) Out[8]: 0.9755555555555555 In [9]: y_log_predict = log_reg.predict(X_test)
混淆矩阵
In [17]: from sklearn.metrics import confusion_matrix ...: confusion_matrix(y_test,y_log_predict) Out[17]: array([[403, 2], [ 9, 36]], dtype=int64)
精准率
In [18]: from sklearn.metrics import precision_score ...: precision_score(y_test,y_log_predict) Out[18