数据挖掘学习笔记-第三章 从贝叶斯到决策树

本文探讨了监督学习中的两种重要方法:决策树和朴素贝叶斯分类器。介绍了贝叶斯公式在癌症与阳性关系的应用,以及决策树算法如ID3的工作原理和属性选择依据,包括熵和增益的概念。

第三章 Bates & Decision Tree Model 

Classification   a kind of supervised learning 

Bates Theorem  

贝叶斯公式的应用:癌症与阳性关系 

 

Naive Bates Classifier      假设:conditionally independent  

 

条件独立的一些例子 

 

 

Independent != Uncorrelated  

避免连乘是出现0,需要做拉普拉斯平滑。 

应用例子

预测某条件下打网球的概率 

文章推荐 

 

 

决策树

Decision Making  

一些规则如:One dataset,many possible trees 

      Simpler tree are generally preferred. 

ID3  常用的决策树 

Entropy  and Gain 

 

根据Entropy 和 Gain 即可做 Attribute Selection  

 

ID3 Frameworks  

 

Overfitting 测试

  pruning  

Entropy Bias 

Continuous Attribute  

Reading Materials  

总结:ID3 是最基本的决策树,还有很多新发展的决策树可以学习,不同的决策树对

连续型的处理,对缺失值的处理都有不同的方式可以去好好学习

 

转载于:https://www.cnblogs.com/xinluo-fresher/p/10763817.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值