
【机器学习】
文章平均质量分 92
安柯白
图像处理/计算机视觉/opencv/c++
展开
-
【拜小白的机器学习】2-机器学习的种类与基本术语概念
根据面临的不同问题,机器学习可以分为如下几类:聚类问题分类问题回归问题强化学习=====================分割线===============1.聚类问题 (无监督学习) 聚类算法属于非监督式学习,通常被用于探索性的分析,是根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。它的目的是使得属于同一簇的样本...原创 2018-05-02 14:28:23 · 541 阅读 · 0 评论 -
【拜小白的机器学习】3-机器学习基本流程与工作环节
、机器学习的应用工作是围绕着数据与算法展开的。可以这么讲:数据+机器学习算法=预测模型数据和算法一起发挥作用,才能构建一个能够使用的预测模型。在这当中,数据的“质”与“量”对最后的结果有着非常大的影响。===================分割线======================一个完整机器学习项目的流程可以如下形式1 抽象成数学问题 明确问题是进行机器学习的第一步。机器学习的训练过程...原创 2018-05-02 17:08:08 · 637 阅读 · 0 评论 -
【拜小白的机器学习】1-机器学习概述(小白入门-深度好文-强烈推荐)
转自:从机器学习谈起此博主将机器学习内容,由浅入深慢慢讲解,让小白能够通俗易懂,是一篇很好的入门文章,感谢博主的细心整理。全文较长,建议阅读时间为30分钟!====================分割线=====================在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的...转载 2018-04-26 14:40:41 · 1211 阅读 · 0 评论 -
【拜小白的机器学习】4-机器学习的评估方法
在进行机器学习常常需要处理的一个问题是划分测试集和训练集。训练集用于训练模型,测试集则是根据训练集的训练结果来评判最终的训练效果。当我们手中没有未知的样本,那么如何进行可靠地评估呢?这里的关键是:在现有的数据集合中获得可靠的“测试集数据”。这里有一个标准,就是测试集(用于评估)应该与训练集(用于学习)尽可能保持“互斥”。常用的数据集划分方法有一下几种:留出法(hold-out)交叉验证法(k-fo...原创 2018-05-04 15:12:21 · 773 阅读 · 0 评论 -
【拜小白的机器学习】6-机器学习中几种距离相似性度量方法
在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,...原创 2018-06-29 15:19:02 · 1525 阅读 · 2 评论 -
【拜小白的机器学习】5-机器学习的评估度量标准(评估)
在上一节中我们主要讲到机器学习的评估方法,其中重点是讲解了三种对数据集的划分方式,包括留出法(hold-out)、交叉验证法(k-fold cross validation)、自助法(bootstrap)。本节来看看机器学习的评估度量标准,其中我们将从回归(Regression)与分类(Classification)两个大类来讨论其中的评估度量标准。==================分割线===...原创 2018-06-27 15:56:49 · 2196 阅读 · 0 评论