- 博客(4)
- 收藏
- 关注
原创 《机器学习实战》第四章学习笔记(已更完)
本章介绍的是朴素贝叶斯的分类方法,条件概率和贝叶斯决策理论这里不做叙述,需要注意的是朴素贝叶斯的前提:即样本的所有特征之间相互独立,这样可以大大减少模型所需的样本数量(意味着所有的特征计算都可以用同一批样本)。 本章主要利用贝叶斯进行文本分类,所以首先涉及到的是文本表示,即怎样把语言信息表示为计算机可以处理的数字信息。 书中给的例子是文本分类,判断网页留言是侮辱性还是非侮辱性的。 首先是文本的构建过程,下面给了一组带有分类标签的文本数据 def loadDataset():#创建了一些实验样.
2022-04-07 16:32:39
1583
2
原创 《机器学习实战》第三章学习笔记(更新中)
第三章主要讲述的内容是决策树的源码和利用Matplotlib绘制树形图 决策树的核心是利用递归一级一级进行分类: def createBranch() If so return 类标签; Else 寻找划分数据集的最好特征(香农熵) 划分数据集 创建分支节点 for 每个划分的子集: 调用函数createBranch()并增加返回结果到分支节点中 return 分支节点 分类的依据是香农熵的计算,其表示的是信息增益的大小,代码及注释如下 def calcShannon
2022-03-24 22:30:56
1965
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人