人工智能(AI)的主要分支可根据技术方法和应用领域划分为以下几类,每种分支解决不同层面的智能问题:
1. 按技术方法划分
(1) 机器学习(Machine Learning, ML)
- 核心:通过数据训练模型,让机器自动学习规律。
- 子领域:
- 监督学习(分类、回归,如垃圾邮件识别)
- 无监督学习(聚类、降维,如客户分群)
- 半监督学习(少量标注数据+大量未标注数据)
- 强化学习(RL,通过环境反馈优化行为)
(2) 深度学习(Deep Learning, DL)
- 核心:基于多层神经网络的机器学习,自动提取特征。
- 典型模型:
- CNN(图像处理,如ResNet)
- RNN/LSTM(时序数据,如语音识别)
- Transformer(NLP,如GPT、BERT)
(3) 强化学习(Reinforcement Learning, RL)
- 核心:通过试错和奖励机制学习最优策略。
- 应用:游戏AI(AlphaGo)、机器人控制、自动驾驶决策。
(4) 符号主义 AI(Symbolic AI)
- 核心:基于逻辑规则和知识表示(如专家系统、知识图谱)。
- 特点:可解释性强,但依赖人工规则。
2. 按应用领域划分
(1) 计算机视觉(Computer Vision, CV)
- 任务:图像分类、目标检测(YOLO)、人脸识别、医学影像分析。
- 技术:CNN、Transformer(ViT)。
(2) 自然语言处理(Natural Language Processing, NLP)
- 任务:机器翻译、情感分析、聊天机器人。
- 技术:词向量(Word2Vec)、大语言模型(LLM,如GPT-4)。
(3) 语音处理(Speech Processing)
- 任务:语音识别(ASR)、语音合成(TTS)。
- 技术:RNN、WaveNet。
(4) 机器人学(Robotics)
- 任务:运动控制、环境感知、人机交互。
- 技术:SLAM(同步定位与建图)、强化学习。
(5) 生成式 AI(Generative AI)
- 任务:文本生成(ChatGPT)、图像生成(Stable Diffusion)、视频生成(Sora)。
- 技术:GAN、Diffusion模型、自回归模型。
(6) 多模态 AI(Multimodal AI)
- 任务:跨模态理解(如图文匹配、视频描述生成)。
- 技术:CLIP、Flamingo。
3. 其他重要分支
- 知识表示与推理(Knowledge Representation & Reasoning):
构建知识图谱(如Google知识图谱),用于逻辑推理。 - 规划与决策(Planning & Decision Making):
路径规划(如A*算法)、动态决策(如马尔可夫决策过程)。 - 联邦学习(Federated Learning):
分布式机器学习,保护数据隐私。 - 神经符号 AI(Neural-Symbolic AI):
结合神经网络与符号推理(如DeepMind的AlphaFold)。
分支关系图
总结
- 基础技术:ML、DL、RL、符号AI是核心方法论。
- 热门应用:CV、NLP、生成式AI、多模态AI是当前主流方向。
- 前沿融合:神经符号AI、具身智能(Embodied AI)是未来趋势。
不同分支常交叉使用,例如自动驾驶融合了CV(感知)、RL(决策)、NLP(语音交互)。