以下是 **机器学习理论树** 的层次化结构,从数学基础到应用分支系统化梳理,涵盖经典理论与前沿方向:
---
### **机器学习理论树**
#### **1. 数学根基**
- **概率与统计**
- 贝叶斯理论(先验/后验概率)
- 统计推断(极大似然估计、假设检验)
- 信息论(熵、KL散度)
- **线性代数**
- 矩阵分解(SVD、PCA)
- 张量运算(深度学习基础)
- **优化理论**
- 凸优化(梯度下降、拉格朗日乘子法)
- 非凸优化(深度学习中的优化困境)
#### **2. 核心理论分支**
- **监督学习**
- 统计学习理论(VC维、结构风险最小化)
- 核方法(SVM、核技巧)
- 决策树理论(ID3/C4.5、基尼系数)
- **无监督学习**
- 聚类理论(k-means、谱聚类)
- 降维理论(流形学习、t-SNE)
- 生成模型(EM算法、GAN理论)
- **强化学习**
- 马尔可夫决策过程(MDP)
- 贝尔曼方程(动态规划)
- Q-Learning与策略梯度理论
#### **3. 深度学习理论**
- **神经网络基础**
- 通用近似定理(Universal Approximation Theorem)
- 反向传播(链式法则的工程化)
- **结构理论**
- CNN(平移不变性理论)
- RNN(序列建模的梯度问题)
- Transformer(自注意力机制理论)
- **训练动力学**
- 梯度消失/爆炸(初始化理论)
- 过拟合与正则化(Dropout、权重衰减)
#### **4. 前沿与交叉理论**
- **可解释性理论**
- SHAP值(博弈论基础)
- 因果推断(Pearl的因果图模型)
- **鲁棒性理论**
- 对抗样本(对抗训练理论)
- 分布外泛化(OOD Generalization)
- **跨领域融合**
- 图神经网络(图表示学习理论)
- 元学习(Few-shot学习理论)
- 量子机器学习(量子特征映射)
#### **5. 应用理论**
- **计算机视觉**
- 图像生成(Diffusion模型理论)
- 目标检测(IoU、NMS算法理论)
- **自然语言处理**
- 词嵌入(Word2Vec理论)
- 预训练语言模型(BERT的Masked LM理论)
- **其他领域**
- 推荐系统(协同过滤理论)
- 时序预测(ARIMA、LSTM理论)
---
### **理论树可视化**
```
数学基础
├─ 概率与统计
├─ 线性代数
└─ 优化理论
↓
核心方法论
├─ 监督学习(统计学习理论、核方法)
├─ 无监督学习(聚类、降维)
└─ 强化学习(MDP、贝尔曼方程)
↓
深度学习
├─ 神经网络基础(近似定理、BP算法)
├─ 结构理论(CNN/RNN/Transformer)
└─ 训练动力学(梯度问题、正则化)
↓
前沿扩展
├─ 可解释性(SHAP、因果推断)
├─ 鲁棒性(对抗样本、OOD泛化)
└─ 跨领域(GNN、元学习)
```
### **关键特点**
1. **理论依赖链**:例如,SVM依赖核方法→核方法依赖再生核希尔伯特空间(RKHS)→RKHS依赖泛函分析。
2. **实践反哺理论**:深度学习中的Batch Normalization现象催生了新的优化理论研究。
3. **未解决问题**:如深度学习泛化理论(为何过参数化模型仍能泛化?)。
如果需要细化某一分支(如"生成模型理论从VAE到Diffusion的演进"),可定向展开。