- 最常见的两种机器学习算法
- Supervised learning
> 给算法一个数据集,其中包含 the right answer,即带有标签。算法的目的进行预测,给出更多的正确答案
> 包括回归问题(regression problem)(eg房价预测,设法预测一个连续值输出)
分类问题(Classification,设法预测一个离散值输出,eg预测肿瘤是良性or恶性)
- Unsupervised learning
> 给算法一个数据集,不带任何标签,试从中找到某种结构。
> 包括聚类算法clustering
(1)应用在基因组学中,在DNA微阵列数据,给定一组不同个体,对于每个个体检测他们是否拥有某个特定的基因,也就是检测基因的表达程度,从而根据它将个体归为不同的类or不同类型的人。
(2)应用在大型的计算机集群,哪些机器趋向于协同工作,从而把它们放在一起,让集群更高效。
(3)社交网络的分析
(4)市场细分
2.其他机器学习算法
Reinforcement learning,recommender systerms
3.学会算法并且要学会如何用这些算法
本文介绍了两种主要的机器学习算法:有监督学习和无监督学习。有监督学习通过已标记的数据集来预测新数据的输出,包括回归和分类问题;无监督学习则是在未标记的数据集中寻找内在结构,如聚类算法的应用等。
499

被折叠的 条评论
为什么被折叠?



