使用朴素贝叶斯分类对二手房数据集进行分类

sklearn中的朴素贝叶斯算法及其在数据分类中的应用

最新推荐文章于 2025-11-25 12:11:01 发布

原创

最新推荐文章于 2025-11-25 12:11:01 发布 · 356 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#分类 #人工智能 #机器学习 #sklearn

sklearn 的 naive_bayes 模块提供了 3 种朴素贝叶斯算法，分别是高斯朴素贝叶斯、多项式朴素贝叶斯和伯努利朴素贝叶斯。这 3 种算法适用于不同的场景，应该根据特征变量的不同选择不同的算法。

高斯朴素贝叶斯：特征变量是连续变量，符合高斯分布，如人的身高、物体的长度。

多项式朴素贝叶斯：特征变量是离散变量，符合多项式分布。例如，在文档分类中，特征变量体现在一个单词出现的次数或者单词的 TF-IDF 值等。

伯努利朴素贝叶斯：特征变量是布尔变量，符合 0/1 分布，如在文档分类中特征是单词是否出现。

# 导入必要的库
import numpy as np
from sklearn import metrics
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import matplotlib.pyplot as plt

# 转换数据并划分
X ,Y= [],[] 
fr = open("./knn.txt")
for line in fr.readlines():
    line = line.strip().split()
    X.append([int(line[

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

cnn-jxx

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数据科学与机器学习案例之客户的信用风险与预测

weixin_43217641的博客

07-29

2369

客户的信用风险预测与分析：对每一个变量进行了描述性统计分析，建立了逻辑回归，svm,glmnet模型

使用Spring boot 构建知识图谱及简单Java GUI学习笔记

duanhang2010的博客

08-12

5569

使用Spring boot 构建知识图谱及简单Java GUI学习笔记一、学习目的开发一个关于房地产法律相关的智能问答系统 1.在简单Java GUI界面中实现一个科大讯飞语音调用及知识图谱API调用，反馈查询结果，实现一个简单的demo中的demo。 2.完成Spark分类器HanLP分词以及Spring boot后端与前端的链接。使用的工具 Eclipse Intel...

1 条评论您还未登录，请先登录后发表或查看评论

使用线性回归预测房价

qq_33267306的博客

03-08

1373

预测房价

【贝叶斯算法】

屏前格物数载深，码间耕耘自沉吟。愿以拙笔解惑困，笑与诸君渡迷津。

09-12

922

朴素贝叶斯（Naive Bayesian）算法是基于贝叶斯定理和特征条件独立假设的分类方法，它通过特征计算分类的概率，选取概率大的情况进行分类，它是经典的机器学习算法之一，也是为数不多的基于概率论的分类算法，因为分类目标是确定的，所以也属于监督学习。

【Python】np.linspace用法介绍

热门推荐

Asher117的博客

02-21

20万+

np.linspace参数： numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0) Return evenly spaced numbers over a specified interval. (在start和stop之间返回均匀间隔的数据) Returns num evenly...

朴素贝叶斯（分类算法）理论+Python代码实现

qq_46426207的博客

01-20

5808

朴素贝叶斯分类器是贝叶斯分类器中最简单，也是最常见的一种分类方法。本文介绍了理论基础和python从零开始实现以及scikit-learn实现朴素贝叶斯算法。

数据挖掘(5.1)--贝叶斯分类

码银的博客

05-28

4244

贝叶斯分类方法是统计学的分类方法,它利用概率统计知识预测给定元组属于特定类的概率。贝叶斯分类基于贝叶斯定理。最简单的贝叶斯分类算法称为朴素贝叶斯分类法。

大道至简：朴素贝叶斯分类器

翱翔的翱

10-11

2293

万物之始,大道至简,衍化至繁。　　　　　　　——ifelse(is.element(this, 道德经), 道德经, unknown) 一、背景提到贝叶斯分类，首先来看下贝叶斯其人，贝叶斯(Thomas Bayes,1701—1761)英国牧师、业余数学家。可别小看了欧洲的牧师，孟德尔，被誉为“遗传学之父”也曾为一名神父，假如你不记得孟德尔是谁，那么你肯定记得高中生物上那个著名的豌豆

使用贝叶斯模型对房价进行预测。

sinat_41843962的博客

02-29

4165

实验试题房屋数据集预处理一、实验概述：【实验要求】保存程序，并自行存档；最终的程序都必须经过测试，验证是正确的；认真记录实验过程及结果，回答实验考试报告中的问题。【实施环境】（使用的材料、设备、软件） Python开发环境二、实验考试内容题目房屋数据集预处理【实验内容】请下载housing.csv文件。这是反应若干个小镇的房价的数据集，对数据...

朴素贝叶斯（Naive Bayes）详细计算公式及代码实现

哈哈的博客

10-24

2866

文章主要介绍了朴素贝叶斯进行分类的相关计算及代码实现。朴素贝叶斯在计算时会将每种可能的情况都会考虑到，然后根据计算出来的概率大小决定最后的结果。可以将该方法应用于表面肌电信号相关动作是别上。🌹🌹。

数据挖掘--贝叶斯分类详解

xifenglie123321的博客

05-30

874

其中，$P(C_i|x)$ 表示在给定样本 $x$ 的条件下，$C_i$ 类别的后验概率；$P(x|C_i)$ 表示在 $C_i$ 类别下，样本 $x$ 出现的条件概率；这样，$P(x_j|C_i)$ 可以通过统计训练数据集中 $C_i$ 类别下第 $j$ 个特征的出现频率来估计。其中，$N_{ij}$ 表示在 $C_i$ 类别下第 $j$ 个特征出现的次数，$N_i$ 表示 $C_i$ 类别下所有特征出现的总次数，$m$ 表示特征的个数，$\alpha$ 是一个常数，通常取值为 $1$。

Python 机器学习经典实例

GitChat

04-12

2万+

内容介绍在如今这个处处以数据驱动的世界中，机器学习正变得越来越大众化。它已经被广泛地应用于不同领域，如搜索引擎、机器人、无人驾驶汽车等。本书首先通过实用的案例介绍机器学习的基础知识，然后介绍一些稍微复杂的机器学习算法，例如支持向量机、极端随机森林、隐马尔可夫模型、条件随机场、深度神经网络，等等。用最火的 Python 语言、通过各种各样的机器学习算法来解决实际问题！书中介绍的主要问题如下。 ...

openGauss 在K12教育场景的数据处理测评：CASE WHEN 实现高效分类

hacker707的博客

11-23

2万+

摘要：本文基于openGauss 6.0.2数据库，针对K12教育场景构建测试环境，重点验证SQL99的CASE WHEN语法在成绩分析、学习评估等业务场景中的应用。测试数据包含1万条学生信息（覆盖3个年级10个班级）、1万条成绩记录（含主科与文理科选考科目）、1万条教师授课记录和3万条出勤记录，数据分布符合K12教育特征。通过随机生成函数构建包含NULL值、文理分科等真实业务特征的数据集，为后续CASE WHEN语法在成绩分级、状态评估等场景的功能验证奠定基础。

LeetCode 分类刷题：112. 路径总和

flashlight_hi的博客

11-23

343

该算法使用深度优先搜索(DFS)判断二叉树是否存在根到叶子的路径和等于目标值。关键点：1)空节点返回false；2)到达叶子节点时若剩余和为0则返回true；3)递归检查左右子树。时间复杂度O(n)，空间复杂度O(n)(最坏情况下)。注意空树必须返回false，因为路径必须从根到叶子节点。

Python结合TensorFlow与Flask构建高性能图像识别与分类平台设计与实战分享：南京智慧安防与工业检测落地经验

2501_94187981的博客

11-23

651

TensorFlow GPU 加速模型推理保证实时性Flask 异步 API支持高并发访问Redis 缓存 + 批量推理提升性能对象存储与元数据管理保证数据安全监控告警体系确保系统长期稳定通过该架构，南京智慧安防和工业检测平台实现百万级图像实时识别、秒级响应和高可用服务，为城市安防和工业自动化提供可靠技术支撑。

【案例共创】线性分类器与支持向量机 - 新闻标题主题分类(SVM)

优快云高校俱乐部官方博客

11-21

549

【案例共创】线性分类器与支持向量机 - 新闻标题主题分类(SVM)

基于学习的人工智能（1）为什么学习？

致力于大数据+AI 的应用创新。

11-24

272

学习是人类最重要的认知活动之一，贯穿我们的一生。出生后，我们无时无刻不在学习：从父母那里学说话，自己尝试走路，从小伙伴那里学会折纸飞机，从老师那里学到语文、数学等各种知识。研究人员始终将光源和风扇放在同一侧，经由学习，玉米幼苗逐渐学会了“有风的地方就会有光”的规律。之后，研究人员移去光源，并改变风扇方向，玉米幼苗依然按照所学知识，向风扇方向生长。1959 年，美国计算机学家亚瑟·塞缪尔设计了一款可以自我学习的跳棋程序，并将这一新方法称为“机器学习”，从而开启了机器自我学习的道路。

三大空间信息焕新：辉视让酒店服务、教育通知、监所管控更智能高效

CalebLXL的博客

11-24

747

走访这些场所后我发现，系统的真正价值不在于那些炫目的屏幕，而在于它构建了一套"空间信息免疫系统"——就像人体淋巴网络般，能智能识别各区域的信息需求，精准输送"营养"，快速清除"毒素"。当我们在酒店大堂不再错过末班机场大巴，在学校走廊偶遇恰好需要的竞赛通知，甚至在高墙内获得规整的信息权时，或许该重新思考：所谓智能化，本质是对空间信息代谢效率的一次外科手术式改造。这种荒诞的割裂感，正是传统信息分发模式崩溃的缩影——直到我最近走访数家采用辉视系统的场所，才意识到我们早已进入"精准信息触达"的新纪元。

（116页PPT）关于5G和新基建赋能智慧工地整体解决方案（附下载方式）