
吴恩达机器学习(本系列是基于黄海广先生的个人笔记加上我自己的相关理解而写的))
cg110778
这个作者很懒,什么都没留下…
展开
-
机器学习之旅(一)
从今以后要常写博客,虽然是个小白,只是把自己学习过程中遇到的问题以及相关知识做个总结,让自己有所收获,能够帮助到其他人就更好了。原创 2018-09-19 22:25:04 · 309 阅读 · 0 评论 -
机器学习之旅(十)
吴恩达教授的机器学习课程的第十周相关内容:1、大规模机器学习1.1、大型数据集的学习如果我们有一个低方差的模型,增加数据集的规模可以帮助你获得更好的结果。我们应该怎样应对一个有 100 万条记录的训练集?以线性回归模型为例,每一次梯度下降迭代,我们都需要计算训练集的误差的平方和,如果我们的学习算法需要有 20 次迭代,这便已经是非常大的计算代价。首先应该做的事是去检查一个这么大规模的...原创 2018-11-17 20:10:22 · 277 阅读 · 0 评论 -
机器学习之旅(九)
吴恩达教授的机器学习课程的第九周相关内容:1、异常检测(Anomaly Detection)1.1、问题的动机异常检测(Anomaly detection)问题。这是机器学习算法的一个常见应用。 这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。上图中,在蓝色圈内的数据属于该组数据的可能性较高,而越是偏远的数据,其属于该组数据的可能性就...原创 2018-11-11 20:06:36 · 248 阅读 · 0 评论 -
机器学习之旅(八)
吴恩达教授的机器学习课程的第八周相关内容:1、聚类(Clustering)1.1、无监督学习:简介在一个典型的监督学习中,我们有一个有标签的训练集,我们的目标是找到能够区分正样本和负样本的决策边界,在这里的监督学习中,我们有一系列标签,我们需要据此拟合一个假设函数。与此不同的是,在非监督学习中,我们的数据没有附带任何标签,我们拿到的数据就是这样的:在这里我们有一系列点,却没有标签。因此,...原创 2018-11-04 20:00:12 · 199 阅读 · 0 评论 -
机器学习之旅(六)
吴恩达教授的机器学习课程的第六周相关内容:1、决定下一步做什么当我们运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么?获得更多的训练实例——通常是有效的, 但代价较大, 下面的方法也可能有效, 可考虑先采用下面的几种方法。尝试减少特征的数量尝试获得更多的特征尝试增加多项式特征尝试减少正则化程度 λ尝试增加正则化程度 λ我们不应该随机选择上面的某种...原创 2018-10-21 19:55:36 · 370 阅读 · 0 评论 -
机器学习之旅(七)
吴恩达教授的机器学习课程的第七周相关内容:支持向量机(Support Vector Machines)1、优化目标还有一个更加强大的算法广泛的应用于工业界和学术界,它被称为支持向量机(Support VectorMachine)。与逻辑回归和神经网络相比,支持向量机,或者简称 SVM,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。将会从逻辑回归开始展示我们如何一点一点修改来...原创 2018-10-28 22:01:51 · 298 阅读 · 0 评论 -
机器学习之旅(四)
吴恩达教授的机器学习课程的第四周相关内容:1、神经网络:表述(Neural Networks: Representation)1.1、非线性假设( Non-linear Hypotheses )我们之前学的,无论是线性回归还是逻辑回归都有这样一个缺点,即: 当特征太多时,计算的负荷会非常大。之前我们已经看到过,使用非线性的多项式项, 能够帮助我们建立更好的分类模型。假设我们有非常多的特征...原创 2018-09-29 18:04:22 · 302 阅读 · 0 评论 -
机器学习之旅(五)
吴恩达教授的机器学习课程的第五周相关内容:1、代价函数首先引入一些便于稍后讨论的新标记方法:假设神经网络的训练样本有 m 个,每个包含一组输入 x 和一组输出信号 y, L 表示神经网络层数, S I 表示每层的 neuron 个数(SL 表示输出层神经元个数), S L 代表最后一层中处理单元的个数。将神经网络的分类定义为两种情况:二类分类和多类分类,在逻辑回归中,我们只有一个输出...原创 2018-10-14 18:32:25 · 248 阅读 · 0 评论 -
机器学习之旅(三)
吴恩达教授的机器学习课程的第三周相关内容:1、逻辑回归(Logistic Regression)1.1、分类问题在分类问题中,你要预测的变量 y 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression) 的算法,这是目前最流行使用最广泛的一种学习算法。我们从二元的分类问题开始讨论。我们将因变量(dependant variable)可能属于的两个类分别称为负向类...原创 2018-09-26 17:50:06 · 347 阅读 · 0 评论 -
机器学习之旅(二)
吴恩达教授的机器学习课程的第二周相关内容:1、多变量线性回归(Linear Regression with Multiple Variables)1.1、多维特征xj(i)x_{j}^{\left ( i \right )}xj(i)代表特征矩阵中第 i 行的第 j 个特征,也就是第 i 个训练实例的第 j 个特征.支持多变量的假设 h 表示为:hθ(x)=θ0+θ1x1+θ2x2+.....原创 2018-09-20 17:27:01 · 149 阅读 · 0 评论 -
机器学习之旅(十一)
吴恩达教授的机器学习课程的第十一周相关内容:1、应用实例:图片文字识别1.1、问题描述和流程图图像文字识别应用所作的事是,从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。为了完成这样的工作,需要采取如下步骤:文字侦测(Text detection) ——将图片上的文字与其他环境对象分离开来字符切分(Character segmentation) ——将文字分割...原创 2018-11-17 22:26:56 · 110 阅读 · 0 评论