问题
朴素贝叶斯求解
- 朴素贝叶斯公式:
- 求解思想:即求先验概率与条件概率乘积的最大值
- 求解
注意:
本人求解过程中忘记了 Laplace 平滑 (⊙︿⊙),但好在预测值里面没有学历为博士的一项,所以不平滑也不影响预测,但这样是不规范的。
代码
- 分析
1 读取数据
2 数据切片,转换(将字符型数据编码)
3 划分训练集和测试集
4 导入 sklearn 贝叶斯方法,拟合
5 预测输入值
#导入数据 read_csv
import pandas as pd
import numpy as np
c=pd.read_csv('career_data.csv')
print c
# 将特征的离散数据 编码 用 LabelEnco