【sklearn实例】1-贝叶斯算法

本文通过实例介绍了如何使用sklearn库中的朴素贝叶斯算法进行分类。讨论了贝叶斯公式、数据预处理、训练与测试集划分、不同类型的贝叶斯分类器之间的差异,并指出在数据编码和维度变化上的思考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题

在这里插入图片描述

朴素贝叶斯求解

  • 朴素贝叶斯公式:
    在这里插入图片描述
  • 求解思想:即求先验概率与条件概率乘积的最大值
    在这里插入图片描述
  • 求解
    在这里插入图片描述

注意:
本人求解过程中忘记了 Laplace 平滑 (⊙︿⊙),但好在预测值里面没有学历为博士的一项,所以不平滑也不影响预测,但这样是不规范的。

代码

  • 分析

1 读取数据
2 数据切片,转换(将字符型数据编码)
3 划分训练集和测试集
4 导入 sklearn 贝叶斯方法,拟合
5 预测输入值

#导入数据 read_csv

import pandas as pd
import numpy as np
c=pd.read_csv('career_data.csv')
print c

# 将特征的离散数据 编码 用 LabelEnco
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值