- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 机器学习-支持向量机(基础)
第 6 章 支持向量机 分类学习的基本思想:基于训练集D,在样本空间中找到一个划分超平面,将不同类别的样本分开。 而支持向量机就是想要找到一个最“正中间”的划分超平面将不同类别的样本划分,也就是下图中加粗的那条线。因为这种情况下,该划分超平面产生的分类结果是最鲁棒的,对未知样本的泛化能力最强。 那么,首先来描述一下超平面: 如下图6.2所示,我们将距离超平面最近的这几个训练样本点,也就是使得上式(6.3)等号成立的点,称为“支持向量”(support vector)。其中两个异类支持向量到超平面的距离之
2021-07-29 23:58:20
979
1
原创 机器学习-神经网络(基础)
第 5 章 神经网络: M-P神经元: 激活函数有两种: 一种是阶跃函数——sgn函数: 还有一种是Sigmoid函数: 5.1 感知机(Perceptron): 感知机由两层神经元组成,输入层接收外界输入信号后传递给输出层,输出层是M-P神经元,也称为“阈值逻辑单元”。 感知机只有输出层神经元进行激活函数处理,即只拥有一层功能神经元。 因此,只能解决“与”、“或”、“非”这种线性可分的数据集的问题,也就是在二维平面中,可以用一条直线,把正负样本分开。但是像“异或”问题,感知机无能为力。
2021-07-25 23:56:13
444
1
原创 机器学习-决策树(四)
第 4 章 决策树 4.1 算法原理: 从逻辑角度,一堆if else语句的组合 从几何角度,根据某种准则划分特征空间。 最终目的:将样本越分越“纯” 信息论内容补充: 信息熵 自信息的期望,随机变量的不确定性的度量 此时的信息熵所代表的“不确定性”可以理解为集合内样本的“纯度”。 条件熵 Y的信息关于概率分布X的期望 信息增益 信息熵-条件熵 最大化信息增益。通过遍历A中所有属性,求出每个属性所有可能取值下的信息熵,计算出每个属性的信息增益,选择信息增益最大的属性作为我们的划分属性。 接着,在这个分
2021-07-23 00:44:56
221
原创 机器学习-DAY1-2
机器学习 (西瓜书)-------周志华 著 Day 1: 第 1 章 绪论 1.1 基本术语: 数据集中的每条记录是关于一个事件或对象的描述——示例(instance) 或样本 (sample). 一个示例也可以称为一个特征向量(feature vector) 反映事件或对象在某方面的表现或性质的事项——属性(attribute)或特征 (feature). 属性取值——属性值(attribute value) 属性张成的空间——属性空间(attribute space)或 样本空间(sa
2021-07-20 00:16:45
720
原创 机器学习-基本术语和模型评估方法
机器学习 (西瓜书)-------周志华 著 Day 1: 第 1 章 绪论 1.1 基本术语: 数据集中的每条记录是关于一个事件或对象的描述——示例(instance) 或样本 (sample). 一个示例也可以称为一个特征向量(feature vector) 反映事件或对象在某方面的表现或性质的事项——属性(attribute)或特征 (feature). 属性取值——属性值(attribute value) 属性张成的空间——属性空间(attribute space)或 样本空间(sa
2021-07-14 09:42:44
573
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人