朴素的贝叶斯分类器(Naive Bayesian Classifier)

朴素贝叶斯分类器基于贝叶斯理论,是一种有监督学习方法,假设属性间相互独立。尽管实际中难以满足这一假设,但在许多情况下仍表现出高精度和效率。该分类器常用于医疗诊断、统计决策等领域。分类器分为朴素贝叶斯和贝叶斯网,后者能表示属性间的因果依赖。贝叶斯分类是非规则分类,通过训练集归纳出分类器,并对未分类数据进行预测。

贝叶斯理论是处理不确定性信息的重要工具。作为一种不确定性推理方法,它基于概率和统计理论,具有坚实的数学基础,贝叶斯网络在处理不确定信息的智能化系统中已经得到了广泛的应用,并且成功地用于医疗诊断、统计决策、专家系统等领域。这些成功的应用,充分说明了贝叶斯技术是一种强有力的不确定性推理方法。贝叶斯分类器分为两种:一种是朴素贝叶斯分类器,另一种贝叶斯网分类器。

朴素贝叶斯分类器是一种有监督的学习方法,其假定一个属性的值对给定类的影响而独立于其他属性值,此限制条件较强,现实中往往不能满足,但是朴素贝叶斯分类器取得了较大的成功,表现出高精度和高效率,具有最小的误分类率,耗时开销小的特征。贝叶斯网分类器是一种有向无环图模型,能够表示属性集间的因果依赖。通过提供图形化的方法来表示知识,以条件概率分布表表示属性依赖关系的强弱,将先验信息和样本知识有机结合起来;通过贝叶斯概率对某一事件未来可能发生的概率进行估计,克服了基于规则的系统所具有的许多概念和计算上的困难。其优点是具有很强的学习和推理能力,能够很好地利用先验知识,缺点是对发生频率较低的事件预测效果不好,且推理与学习过程是NP—Hard的。

分类有基于规则的分类(查询)和非规则分类(有指导学习)。贝叶斯分类是非规则分类,它通过训练集(已分类的例子集)训练而归纳出分类器(被预测变量是离散的称为分类,连续的称为回归),并利用分类器对未分类的数据进行分类。贝叶斯分类器中有代表性的分类器有朴素贝叶斯分类器、贝叶斯网络分类器和树增强朴素贝叶斯分类模型TAN等。


贝叶斯分类具有如下特点:

(1)贝叶斯分类并不是把一个实例绝对指派给某一类,而是通过计算得出属于某一类的概率,具有最大概率的类是该实例所属的类。

(2)一般情况下在贝叶斯分类中的所有属性都直接或间接地发挥作用,即所有的属性都参与分类,而不是一个或几个属性决定分类。

(3)贝叶斯分类实例的属性可以是离散的、连续的,也可以是混合的。

假设A1,A2,...,An是数据集的n个特征(属性),假设有m个类,C={C1.C2,...Cm}给定一个具体的实例工其属性为{xl,x2,...,Xn},这里Xi是属性Ai的具体取值,该实例属于某一个类
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值