
机器学习
文章平均质量分 76
都给我吃吧
这个作者很懒,什么都没留下…
展开
-
决策树案例:是否打网球
决策树的划分依据之一是信息增益的大小对于下面这个例子,使用ID3算法,ID3:使用信息增益g(D,A)进行特征选择一个特征的信息增益(或信息增益率,或基尼系数)越大,表明特征对样本的熵的减少能力更强,这个特征使得数据由不确定性到确定性的能力越强下面就以一个经典的打网球的例子来说明如何构建决策树。我们今天是否去打网球(play)主要由天气(outlook)、温度(temperature)、湿度(humidity)、是否有风(windy)来确定。样本中共14条数据那么在计算...原创 2021-08-16 22:00:55 · 5907 阅读 · 0 评论 -
机器学习-K近邻算法
KNN 场景电影可以按照题材分类,那么如何区分 动作片 和 爱情片 呢?动作片: 打斗次数更多爱情片: 亲吻次数更多基于电影中的亲吻、打斗出现的次数,使用 k-近邻算法构造程序,就可以自动划分电影的题材类型。现在根据上面我们得到的样本集中所有电影与未知电影的距离,按照距离递增排序,可以找到 k 个距离最近的电影。假定 k=3,则三个最靠近的电影依次是, He’s Not Really into Dudes 、 Beautiful Woman 和 California Man。knn 算原创 2021-08-08 15:56:13 · 630 阅读 · 0 评论