阶段 0:准备阶段(基石)
-
数学基础 (非常重要!):
- 线性代数: 向量、矩阵、张量、特征值/特征向量、奇异值分解。几乎所有AI模型的核心。
- 微积分: 导数、偏导数、梯度(优化算法的核心)、积分(理解概率分布)。
- 概率论与统计学: 概率分布(特别是高斯分布)、贝叶斯定理、期望、方差、协方差、假设检验、最大似然估计。理解数据不确定性和模型评估的基础。
- (可选但有益)离散数学、信息论、优化理论: 为特定领域(如算法、强化学习)提供更深基础。
- 建议: 不必追求数学证明的深度,重点理解概念、几何意义及其在AI中的应用。
-
编程基础 (工具):
- Python: 绝对首选语言。易学、强大的库生态。精通Python语法、数据结构、函数、面向对象编程、文件操作。
- 关键库:
NumPy: 高效数值计算(数组、矩阵)。Pandas: 数据处理与分析利器(表格数据)。Matplotlib/Seaborn: 数据可视化。
- (可选)基础算法与数据结构: 理解时间/空间复杂度、常用算法(排序、搜索)。
- 环境: 熟悉使用
Jupyter Notebook/JupyterLab(交互式开发)和Anaconda(包和环境管理)。
阶段 1:机器学习基础
- 核心概念: 理解监督学习、无监督学习、强化学习的概念、区别和应用场景。理解过拟合、欠拟合、偏差-方差权衡、交叉验证、评估指标(准确率、精确率、召回率、F1、AUC、RMSE等)。
- 经典机器学习算法 (理论与实践并重):
- 监督学习:
- 线性回归、逻辑回归
- 决策树、随机森林、梯度提升树
- 支持向量机
- K近邻
- 无监督学习:
- K-Means聚类
- 层次聚类
- 主成分分析 / 降维技术
- 关联规则(如Apriori)
- 监督学习:
- 工具:
Scikit-learn: 核心库,几乎包含上述所有经典算法的优秀实现和工具链(数据预处理、模型选择、评估)。重点掌握其API和Pipeline概念。
- 重点: 这个阶段的核心是理解不同算法的原理、适用场

最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



