最近在学习人工智能领域知识,随手记录一下知识点,以防忘记。通过本篇文章,读者可了解机器学习、深度学习和强化学习三者的基础概念及区别,以便找准大致框架,相关知识整理及总结如下:
一、定义
-
机器学习(Machine Learning, ML)
机器学习是人工智能的核心分支,属于人工智能的子领域,通过数据驱动的方式让计算机系统自动学习模式和规律,即研究如何让计算机从数据中自动学习规律。主要思想是从数据中提取特征,构建模型进行预测或决策。- 主要分类:
- 监督学习:如分类、回归,使用带标签的数据训练模型
- 无监督学习:如聚类、降维,从无标签数据中发现结构
- 半监督学习:结合少量标签数据和大量未标注数据
- 主要分类:
-
深度学习(Deep Learning, DL)
深度学习是机器学习的子领域,基于深层人工神经网络(可包含多个隐藏层),能够自动学习数据的多层次抽象表示。- 主要技术:
- 反向传播算法:优化网络权重
- 卷积神经网络(CNN):擅长图像处理
- 循环神经网络(RNN):处理序列数据(如LSTM、GRU)
- Transformer框架:用于自然语言处理(如BERT、GPT)
- 特点:依赖大规模数据和高算力(如GPU),用于处理高维、非结构化数据(图像、语音、文本等)
- 主要技术:
-
强化学习(Reinforcement Learning, RL)
强化学习在传统上也属于机器学习的子领域,但因其独特的学习方式(不依赖静态数据集),也被视为与监督/无监督学习并列的独立范式。它关注智能体(Agent)通过与环境交互学习最优策略,核心思想是的“试错+延迟奖励”。- 关键要素:
- 状态(State)、动作(Action)、奖励(Reward)、策略(Policy)
- 经典算法:Q-Learning、深度Q网络(DQN)、策略梯度(Policy Gradient)、Actor-Critic
- 特点:无需标注数据,但需要设计合理的奖励函数和环境模拟
- 关键要素:
二、简单理解
-
机器学习比作一名学生,通过课本(数据)学习知识(模型)
-
深度学习是这名学生中的“学霸”,用复杂的笔记(神经网络)总结知识,尤其擅长理解图片和语言
-
强化学习则像一名游戏玩家,通过不断试错(交互)找到通关策略,而当他结合深度学习时,就变成了一个“既会记笔记又会打游戏的全能选手”(如AlphaGo)
三、所属关系
- 机器学习是总的框架,包含深度学习和强化学习
- 深度学习是机器学习的一种技术实现(基于深度神经网络)
- 强化学习是独立的学习范式,但常与深度学习结合(如深度强化学习)
值得注意的是,机器学习的任务与模型是可以相互组合的,即有非深度/深度监督学习、非深度/深度强化学习、非深度/深度无监督学习等