
机器学习实战
前七章主要研究分类算法,第 2 章讲述最简单的分类算法 :k- 近邻算法,它使用某
种距离计算方法进行分类;第 3 章引入了决策树,它比较直观,容易理解,但是相对难于实现;
第 4 章将讨论如何使用概率论建立分类器 ;第 5 章将讨论 Logistic 回归,如何使用最优参数正
行路者-慢慢来
计算机改变自己
展开
-
熵、联合熵、条件熵、相对熵、互信息的定义
为了更好的理解,需要了解的概率必备知识有:大写字母X表示随机变量,小写字母x表示随机变量X的某个具体的取值;P(X)表示随机变量X的概率分布,P(X,Y)表示随机变量X、Y的联合概率分布,P(Y|X)表示已知随机变量X的情况下随机变量Y的条件概率分布;p(X = x)表示随机变量X取某个具体值的概率,简记为p(x);p(X = x, Y = y) 表示联合概率,简记为p(x,y),p(Y ...原创 2019-11-29 16:27:56 · 1219 阅读 · 0 评论 -
python数据分析
python数据分析数据分析工具Numpy:提供数组功能,以及对数据快速处理的函数,创建数组 np.array([])Scipy:提供矩阵计算,功能有最优化,线性代数,积分,插值,拟合,特殊函数,快速傅里叶变换,常微分方程求解等。Matplotlib功能主要是提供数据可视化,Pandas功能:有类似SQL的增删改查,并且带有丰富的数据处理函数,支持时间序列分析功能,支持灵活处理缺失数据...原创 2019-10-22 15:42:21 · 312 阅读 · 0 评论 -
决策树实例之预测隐形眼镜类型
本节我们将通过一个例子讲解决策树如何预测患者需要佩戴的隐形眼镜类别,使用小数据集,我们就可以利用决策树学到很多知识使用决策树预测隐形眼镜类型 收集数据:提供的文本文件 准备数据:解析tab键分隔的数据行 分析数据:快速检查数据,确保正确地解析数据内容,使用createPlot()函数绘制最终的树形图 训练算法:使用上个博客的createTree()函数 测试算法:编写测试函数...原创 2019-06-26 09:56:57 · 2469 阅读 · 0 评论 -
《机器学习实战》之决策树
本章内容决策树简介 在数据集中度量一致性 使用递归构造决策树 使用matplotlib绘制树形图决策树,顾名思义就是有很多节点到达每一个节点都要判断应该往哪里走决策树的构造决策树 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不想管特征数据。 缺点:可能会产生过度匹配问题 适用数据类型:数值型和标称型 要使用算法构造决策树,我们...原创 2019-06-24 09:00:55 · 189 阅读 · 0 评论 -
《机器学习实战》之K-近邻算法
本章内容k-近邻分类算法 从文本文件中解析和导入数据 使用Matplotlib创建扩散图 归一化数值k-近邻算法描述k-近邻算法采用测量不同特征值之间的距离方法进行分类。k-近邻算法 优点:精度高,对异常值不敏感,无数据输入假定 缺点:计算复杂度高,空间复杂度高。 适用数据范围:数值型和标量型。 工作原理:存在一个样本数据集合,即训练样本集,并且样本集中每...原创 2019-06-20 17:00:21 · 154 阅读 · 0 评论 -
《机器学习实战》之基础
何为机器学习机器学习就是把无序的数据转换成有用的信息机器学习的主要任务监督学习:特点必须知道目标变量的分类信息。常用的就是分类和回归问题 无监督学习:特点不会给定目标值,数据是没有类别信息,常用的就是聚类 监督学习的用途 k-近邻算法 线性回归 朴素贝叶...原创 2019-06-17 16:20:47 · 197 阅读 · 0 评论