目录
ROC(Receiver Operating Characteristic)曲线
本学习笔记为阿里云天池龙珠计划金融风控训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampfr
学习知识点概要
本篇文章主要是笔者通过阿里云AI训练营金融风控中所教授的内容以及结合查阅的资料和个人的理解来描述金融风控数据挖掘中的一些名词进行解释,如数据概况,分类算法及其评估指标等等。
学习内容
1数据概况
即数据的大致情况,说明列的大致特征,可以帮我们更好地理解数据以及对后续分析打下良好的基础。
2分类算法中常见的评估指标
1混淆矩阵(Confuse Matrix)
混淆矩阵中有两种指标,一种是对于预测类别的记录,若预测类别为正,则记为P(positive),若预测类别为负,则记为N(Negitive);另一种指标是对于预测类别的结果的正确与否进行的记录,
若预测结果正确,那么记为T(Ture),反之则为F(False)。通过这两个数据,我们便可以建立一个矩阵,即“混淆矩阵”。
根据这张图片,我们可以得出两个公式
表示有多少预测类别为正的数据的结果是正确的,即
召回率(查全率)
表示样本中有多少的类别为正的数据被预测正确了,即
准确率
预测正确的样本在所有样本中的比率