机器学习 -- 朴素贝叶斯分类与K-means聚类简述

一、有监督学习方法举例

1. 朴素贝叶斯分类

  朴素贝叶斯分类是一种十分简单的分类算法,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
  通俗来说,就像我们坐地铁的时候,仅仅通过一些衣着特征我们便能够猜测周围人的工作或者是身份地位,比如一个人西装革履,那么我们猜测他应该是个工薪一族,有人身穿工作服,那我们也可以认为他应该是个工人。但是这样的推断是不一定正确的,万一人家穿着西装是去参加毕业典礼呢?不过在没有其它可用信息下,我们还是会选择可能性最大的情况。同样的道理,朴素贝叶斯的思想基础就是选择条件概率最大的类别。
  朴素贝叶斯分类是建立在贝叶斯定理的基础上的,这就涉及到大二学的条件概率的知识了。在条件概率中有如下计算公式:
P ( A ∣ B ) = P ( A B ) P ( B ) (1) P(A|B) = \frac{P(AB)}{P(B)} \tag{1} P(AB)=P(B)P(AB)(1)
P ( B ∣ A ) = P ( A B ) P ( A ) (2) P(B|A) = \frac{P(AB)}{P(A)} \tag{2} P(BA)=P(A)P(AB)(2)

  通过 ( 1 ) 、 ( 2 ) (1)、(2) (1)(2)h很容易就得到贝叶斯定理的计算公式:
P ( B ∣ A ) = P ( A ∣ B ) P ( A ) P ( B ) (3) P(B|A) = \frac{P(A|B)P(A)}{P(B)} \tag{3} P(BA)=P(B)P(AB)P(A)(3)

  在已知 P ( A ∣ B ) 、 P ( A ) 、 P ( B ) P(A|B)、P(A)、P(B) P(AB)P(A)P(B)的情况下,我们便能够算出 P ( B ∣ A ) P(B|A) P(BA)
  下面给出朴素贝叶斯分类的正式定义:
  【1】假设有类别集合 C = { y 1 , y 2 , . . . , y m } C = \{ {y_1, y_2,... ,y_m}\} C={ y1,y2,...,ym} ,其中 y k y_k yk 表示某一类别,比如汽车、房屋等;
  【2】假设有一待分类对象 x = { a 1 , a 2 , . . . , a n } x = \{ {a_1,a_2,...,a_n}\} x={ a1,a2,...,a

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值