使用朴素贝叶斯分类对二手房数据集进行分类

sklearn 的 naive_bayes 模块提供了 3 种朴素贝叶斯算法,分别是高斯朴素贝叶斯、多项式朴素贝叶斯和伯努利朴素贝叶斯。这 3 种算法适用于不同的场景,应该根据特征变量的不同选择不同的算法。

  1. 高斯朴素贝叶斯:特征变量是连续变量,符合高斯分布,如人的身高、物体的长度。
  2. 多项式朴素贝叶斯:特征变量是离散变量,符合多项式分布。例如,在文档分类中,特征变量体现在一个单词出现的次数或者单词的 TF-IDF 值等。
  3. 伯努利朴素贝叶斯:特征变量是布尔变量,符合 0/1 分布,如在文档分类中特征是单词是否出现。
# 导入必要的库
import numpy as np
from sklearn import metrics
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import matplotlib.pyplot as plt
# 转换数据并划分
X ,Y= [],[] 
fr = open("./knn.txt")
for line in fr.readlines():
    line = line.strip().split()
    X.append([int(line[
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值