使用朴素贝叶斯进行个人信用风险评估

本文介绍了朴素贝叶斯算法的基本原理及多种实现方式,并通过一个信用风险评估案例展示了如何预处理数据、选择模型、评估模型性能及进行模型调优。

朴素贝叶斯

朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,即“简单”地假设每对特征之间相互独立。 给定一个类别yyy和一个从x1x_1x1xnx_nxn的相关的特征向量,贝叶斯定理阐述了一下关系:
P(y∣x1,…,xn)=P(y)P(x1,…,xn∣y)P(x1,…,xn)P(y \mid x_1, \dots, x_n) = \frac{P(y) P(x_1, \dots, x_n \mid y)}{P(x_1, \dots, x_n)}P(yx1,,xn)=P(x1,,xn)P(y)P(x1,,xny)
使用简单(naive)的假设-每对特征之间都相互独立:
P(xi∣y,x1,…,xi−1,xi+1,…,xn)=P(xi∣y)P(x_i | y, x_1, \dots, x_{i-1}, x_{i+1}, \dots, x_n) = P(x_i | y)P(xiy,x1,,xi1,xi+1,,xn)=P(xiy)
对于所有的iii都成立,这个关系式可以简化为:
P(y∣x1,…,xn)=P(y)∏i=1nP(xi∣y)P(x1,…,xn)P(y \mid x_1, \dots, x_n) = \frac{P(y) \prod_{i=1}^{n} P(x_i \mid y)}{P(x_1, \dots, x_n)}P(yx1,,xn)=P(x1,,xn)P(y)i=1nP(xiy)
由于在给定的输入中P(x1,...,xn)P(x_1,...,x_n)P(x1

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值