阿里云天池 金融风控训练营 数据挖掘-Task1 学习笔记

目录

 

学习知识点概要

学习内容

1数据概况

2分类算法中常见的评估指标

召回率(查全率)

P-R曲线

ROC(Receiver Operating Characteristic)曲线


本学习笔记为阿里云天池龙珠计划金融风控训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampfr

学习知识点概要

本篇文章主要是笔者通过阿里云AI训练营金融风控中所教授的内容以及结合查阅的资料和个人的理解来描述金融风控数据挖掘中的一些名词进行解释,如数据概况,分类算法及其评估指标等等。

学习内容

1数据概况

即数据的大致情况,说明列的大致特征,可以帮我们更好地理解数据以及对后续分析打下良好的基础。

2分类算法中常见的评估指标

1混淆矩阵(Confuse Matrix)

混淆矩阵中有两种指标,一种是对于预测类别的记录,若预测类别为正,则记为P(positive),若预测类别为负,则记为N(Negitive);另一种指标是对于预测类别的结果的正确与否进行的记录,

若预测结果正确,那么记为T(Ture),反之则为F(False)。通过这两个数据,我们便可以建立一个矩阵,即“混淆矩阵”。

图片来源

根据这张图片,我们可以得出两个公式

表示有多少预测类别为正的数据的结果是正确的,即

P r e c i s i o n=\frac{TP}{TP+FP}

召回率(查全率)

表示样本中有多少的类别为正的数据被预测正确了,即

R e c a l l =\frac{TP}{TP+FN}

准确率

预测正确的样本在所有样本中的比率

Accuracy=\frac{TP+TN}{TP+TN+FP+FN}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值