性能曲线
构建并展示分类器评估的性能曲线。
输入
● 评估结果:分类算法测试的结果
输出
• 校准后的模型:使用校准学习器训练的模型
性能曲线展示了分析真正例(true positive)数据实例比例与分类器阈值或分类为正例的实例数量之间的关系曲线。它提供三种类型的性能曲线:提升曲线、累积增益图和精确率-召回率曲线。
提升曲线显示提升度(预测中真正例占所有预测正例的比例)与正例实例比例之间的比率。曲线初始部分越高且保持平坦的时间越长,模型性能越好。详见教程。
累积增益图展示真正例比例(例如,患有心脏病的人群)与支持度(预测为正例的实例占比,假设实例按模型预测为正例的概率排序,如某人患病的概率)。曲线与基线(虚线对角线)之间的面积越大,模型性能越好。
精确率-召回率曲线显示不同阈值下精确率(正预测中真正例的占比)与召回率(正类中真正例的占比)之间的关系。理想情况下,曲线下面积(AUC)越高越好。