
机器学习
weixin_44565882
这个作者很懒,什么都没留下…
展开
-
【机器学习】基本概念
机器学习 机器学习概念: 机器学习概念: 从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测 应用场景: 自然语言处理;无人驾驶;计算机视觉 数据类型: 离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。 连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连...原创 2019-10-03 19:01:35 · 110 阅读 · 0 评论 -
【机器学习】K近邻算法;朴素贝叶斯;决策树和随机森林
分类算法-k近邻算法(KNN) 定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 计算距离公式: 两个样本的距离可以通过如下公式计算,又叫欧式距离。比如说,a(a1,a2,a3),b(b1,b2,b3) 基本语法 sklearn.neighbors.KNeighborsClassifier(n_neighbor...原创 2019-10-03 19:00:18 · 1008 阅读 · 0 评论 -
【机器学习】决策树算法
ID3 ID3是一种基于信息熵的决策树分类学习算法,以信息增益和信息熵作为对象分类的衡量标准。 ID3算法结构简单、学习能力强、分类速度快适合大规模数据分类。但同时由于信息增益的不稳定性,容易倾向于众数属性导致过度拟合,算法抗干扰能力差。 ID3算法的核心思想:利用信息熵原理选择信息增益最大的属性作为分类属性,递归地拓展决策树的分枝,完成决策树的构造 这种算法的优点就是方法简单、计算量小、...原创 2020-03-04 20:16:39 · 373 阅读 · 0 评论 -
【机器学习】支持向量机
简介 支持向量机(support vector machines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。由简至繁的模型包括: 当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机; 当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机; 当训练样本线性不可分时,通过核技巧和软间隔最...原创 2020-03-15 20:08:59 · 261 阅读 · 0 评论