算法部分

算法原则之一:优先尝试简单原则。

1,朴素贝叶斯分类:

算法使用前提:所有变量对分类均是有用的,即输出依赖于所有的属性;这些变量是相互独立的,即不相关的。之所以称为“朴素”,就是因为这些假设从未被证实过。

http://www.cnblogs.com/zhangchaoyang/articles/2586402.html

(1)如果出现0频现象的话,就违背了基本假设,输出依赖于所有属性,此时需要进行平滑处理

(2)如果属性取值为连续数值变量(数值属性的时候),假定服从正太分布。

(3)朴素贝叶斯可以用于文档分类

(上述公式怎么看?)

朴素贝叶斯未必不优于其他方法。

 

2,归纳决策树ID3:

http://www.cnblogs.com/zhangchaoyang/articles/2196631.html

(随着树深度增加,节点的熵值迅速降低,目标是得到一棵高度最矮的决策树?)

选择信息增益最大的作为决策树的根节点,直到所有的叶子节点为纯节点

问题:分类问题为什么能够转换为一刻决策树,朴素贝叶斯公式解读?

 

3,C4.5十大算法之首

http://www.cnblogs.com/zhangchaoyang/articles/2842490.html

不过说句实话,看不大明白

 

 

转载于:https://www.cnblogs.com/bobodeboke/p/3351646.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值