有监督学习、无监督学习、分类、聚类、回归等概念
这篇是很久之前写的了.. 后来才开始上 Andrew Ng 老师的 MOOC,发现其实老师讲得很好了,建议有时间看看他的《Machina Learning》,只看第一节课就可以很了解这些概念了。
主要内容
- 有监督学习、无监督学习、分类、聚类、回归等概念
有监督学习、无监督学习、分类、聚类、回归等概念
这里举一个给书本分类的例子。部分参考 什么是无监督学习? - 王丰的回答 - 知乎 。
特征(feature)
数据的特征。
书的内容。
标签(label)
数据的标签。
书属于的类别,例如“计算机”“图形学”“英文书”“教材”等。
学习(learning)
将很多数据丢给计算机分析,以此来训练该计算机,培养计算机给数据分类的能力。换句话说,学习指的就是找到特征与标签的映射(mapping)关系。这样当有特征而无标签的未知数据输入时,我们就可以通过已有的关系得到未知数据标签。
把很多书交给一个学生,培养他给书本分类的能力。
有监督学习(supervised learning)