一、概念
学习能力是智能的重要标志之一。机器学习是人工智能的核心研究课题之一。
从大量的数据中学习获得经验,从而预测未知的结果
程序从经验(E)中学习,达到一定的性能(P),完成特定的任务(T)
二、重点内容
机器学习分类可以分为监督学习、无监督学习、半监督学习和强化学习四种类型
本篇文章着重讲一下监督学习和无监督学习
1.监督学习(Supervised Learning):
在监督学习中,算法通过已知的标签的训练数据来学习输入和输出之间的映射关系,然后根据学习到的模式对新数据进行预测和分类(有人为辅助,给出一个答案,机器去预测是什么东西(有标签))
回归:线性回归eg:房价预测(连续)
连续:具体的值
分类:逻辑回归eg:乳腺癌分类(离散)
输出值:离散:0或1
2.无监督学习(Unsupervised Learning):
监督学习中,算法只能从输入数据中学习模式和结构,而不需要标签或指导。常见的无监督学习任务包括聚类、降维和关联规则学习。
不给出答案,让机器从数据的内在特征中去聚类(无标签)
聚类:新闻分类
降维:基因序列
3.半监督学习(Semi-supervised Learning):
半监督学习结合了监督学习和无监督学习的特点,利用一小部分标记的数据和大量未标记的数据进行学习。它通常可以提高监督学习的性能,特别是当标记数据稀缺或昂贵时。
4.强化学习(Reinforcement Learning):
强化学习是一种通过代理与环境交互,根据环境的奖励信号学习最优行为策略的方法。强化学习适用于需要长期决策和迭代优化的问题,如游戏、机器人控制和金融交易等领域。
三、区别
他们最大的区别就是模型在训练时需要人工标注的标签信息,监督学习利用大量的标注数据来训练模型,使模型最终学习到输入和输出标签之间的相关性;半监督学习利用少量有标签的数据和大量无标签的数据来训练网络;而无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系,比如聚类。
使用监督学习时我们需要足够的标记数据。为了获得这些信息,需要手工标记数据(图像/文本),这是一个既耗时又昂贵的过程。还有一些领域,比如医疗领域,获取足够的数据本身就是一个挑战。而在使用无监督学习的时候,例如自编码器,仅仅是做了维度的降低而已,并没有包含更多的语义特征,对下游任务并没有很大的帮助。