分类是将数据根据一定的规律进行分类,进入模型能够对未来数据进行预测。 应用场景包括: 判断邮件是否是垃圾邮件 判断是否发放贷款 判断是否为不良用户 常见的分类算法包括: 朴素贝叶斯 支持向量机 逻辑回归 决策树 KNN临近算法 目录 评价指标 值指标 准确率 Accuracy 精确率 Precision 召回率 Recall F-Score 图指标 Precision-Recall PR曲线 ROC曲线 评价指标 值指标 准确率 Accuracy 正确分类的样本数与总样本数之比(预测对的总样本 / 总总样本数) 如图,准确率为 精确率 Precision 判定为正例中真正正例数与判定为正例数之比(预测满足指标的样本中有多少是预测正确的)