朴素贝叶斯
朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,即“简单”地假设每对特征之间相互独立。 给定一个类别yyy和一个从x1x_1x1到xnx_nxn的相关的特征向量,贝叶斯定理阐述了一下关系:
P(y∣x1,…,xn)=P(y)P(x1,…,xn∣y)P(x1,…,xn)P(y \mid x_1, \dots, x_n) = \frac{P(y) P(x_1, \dots, x_n \mid y)}{P(x_1, \dots, x_n)}P(y∣x1,…,xn)=P(x1,…,xn)P(y)P(x1,…,xn∣y)
使用简单(naive)的假设-每对特征之间都相互独立:
P(xi∣y,x1,…,xi−1,xi+1,…,xn)=P(xi∣y)P(x_i | y, x_1, \dots, x_{i-1}, x_{i+1}, \dots, x_n) = P(x_i | y)P(xi∣y,x1,…,xi−1,xi+1,…,xn)=P(xi∣y)
对于所有的iii都成立,这个关系式可以简化为:
P(y∣x1,…,xn)=P(y)∏i=1nP(xi∣y)P(x1,…,xn)P(y \mid x_1, \dots, x_n) = \frac{P(y) \prod_{i=1}^{n} P(x_i \mid y)}{P(x_1, \dots, x_n)}P(y∣x1,…,xn)=P(x1,…,xn)P(y)∏i=1nP(xi∣y)
由于在给定的输入中P(x1,...,xn)P(x_1,...,x_n)P(x1

本文介绍了朴素贝叶斯算法的基本原理及多种实现方式,并通过一个信用风险评估案例展示了如何预处理数据、选择模型、评估模型性能及进行模型调优。
最低0.47元/天 解锁文章
1122





