
机器学习
是个小尾巴呀
这个作者很懒,什么都没留下…
展开
-
机器学习--第三周
十四、无监督学习14.1 K-Means算法K-均值是最普及的聚类算法,算法接受一个未标记的数据集,然后将数据聚类成不同的组。K-均值是一个迭代算法,假设我们想要将数据聚类成n个组,其方法为:1、选择K个随机的点,称为聚类中心(cluster centroids);2、对于数据集中的每一个数据,按照距离个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。3、计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。重复2、3步骤直至中心点不再变化。K-均值原创 2020-06-16 09:05:41 · 248 阅读 · 0 评论 -
机器学习--第二周
四、多变量线性回归4.1 梯度下降法实践–学习率4.2 正规方程4.2.1 正规方程表达式:summary总结一下,只要特征变量的数目并不大,标准方程是一个很好的计算参数的替代方法。具体地说,只要特征变量数量小于一万,我通常使用标准方程法,而不使用梯度下降法。随着我们要讲的学习算法越来越复杂,例如,当我们讲到分类算法,像逻辑回归算法,我们会看到,实际上对于那些算法,并不能使用标准方程法。对于那些更复杂的学习算法,我们将不得不仍然使用梯度下降法。因此,梯度下降法是一个非常有用的算法,可以用原创 2020-06-12 09:33:33 · 4511 阅读 · 0 评论 -
机器学习--第一周
一、引言1.1 监督学习监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组成。在房价的例子中,我们给了一系列房子的数据,我们给定数据集中每个样本的正确价格,即它们实际的售价然后运用学习算法,算出更多的正确答案。比如你朋友那个新房子的价格。用术语来讲,这叫做回归问题。我们试着推测出一个连续值的结果,即房子的价格。监督学习的基本思想:我们数据集中的每个样本都有相应的“正确答案”。再根据这些样本作出预测,就像房子和肿瘤的例子中做的那样。我们还介绍了回归问题,即通过回归来推出一个连续的输出原创 2020-06-04 21:42:21 · 149 阅读 · 0 评论