
机器学习
文章平均质量分 87
小纸君
在校大学生,欢迎一起交流进步
展开
-
机器学习——贝叶斯分类器(基础理论+编程)
计算 对于给定的一个样本test('attr1':'value1','attr2':'value2',..,),已知它所有的属性,则它是类别Class的概率【这里仅考虑离散属性】),计算这个西瓜是好瓜的概率和是坏瓜的概率,比较大小,哪个概率较大,该西瓜就属于哪一类。问题:若某个属性值在训练集中没有与某个类同时出现过,则直接将概率连乘,会导致“哪怕在其他属性上明显像好瓜,分类的结果都将是坏瓜”的情况。结果解析,最上方的红色和黄色框指的是好瓜中密度的均值、方差以及含糖率的密度和均值。(复现西瓜书7.3的例题)原创 2024-03-24 21:09:17 · 1529 阅读 · 2 评论 -
机器学习——决策树(四)后剪枝
这是本人决策树相关的,前3篇的内容如下:1、建造训练集的决策树【完成结点类编写和建树过程】2、用验证集评估模型、选出泛化较好的数据划分方式训练模型3、预剪枝读者可根据需要从上方《机器学习》专栏中查阅对应文章第四章是后剪枝的内容,完整代码都被集成到了colab的notebook当中,读者可以直接运行。原创 2024-03-21 16:56:14 · 1921 阅读 · 1 评论 -
机器学习——决策树(三)预剪枝
这是本人机器学习决策树内容的第三篇博客沿用了之前相关的代码,包括信息增益计算函数、结点类、预测函数和分类精度计算函数。原创 2024-03-21 01:04:54 · 1691 阅读 · 1 评论 -
机器学习——编程从零实现决策树【二】
④ 组合不同的训练集和验证集,对模型进行训练、评估,记录。⑤ 找出训练集精度和验证集精度之和最高的模型。最后一行显示分类精度:约为0.8333。③ 模型评估函数,返回指标精度。1. 从好瓜里面选出3个。2. 从坏瓜里面选出3个。① 打乱原始数据集的数据。② 将数据集划分若干份。原创 2024-03-18 19:09:04 · 700 阅读 · 0 评论 -
机器学习——编程实现从零构造训练集的决策树
从零搭建决策树原创 2024-03-18 00:39:41 · 1145 阅读 · 0 评论