人工智能:从原理到工程实践系统化课程
模块一:人工智能导论与历史脉络
第1章:人工智能的愿景与定义
1.1 智能的本质与哲学思考:图灵机、心智哲学与智能定义
1.2 人工智能的多维度定义:弱AI、强AI与超级AI的理论边界
1.3 衡量AI的标准:图灵测试、中文房间与认知科学的视角
1.4 AI的终极目标:通用人工智能与专用人工智能的现实路径
第2章:人工智能发展简史
2.1 孕育期(1943-1955):麦卡洛克-皮茨神经元模型、控制论与达特茅斯会议
2.2 黄金年代(1956-1974):推理证明、感知机与早期乐观主义
2.3 第一次AI寒冬(1974-1980):计算瓶颈、明斯基的批判与资金撤退
2.4 专家系统繁荣(1980-1987):知识工程、商业应用与第五代计算机计划
2.5 第二次寒冬与统计学习崛起(1987-1993):专家系统局限与概率方法复兴
2.6 机器学习时代(1993-2006):支持向量机、贝叶斯网络与算法进步
2.7 深度学习革命(2006至今):神经网络的复兴、ImageNet竞赛与大模型时代
第3章:人工智能的主要学派与技术范式
3.1 符号主义:基于逻辑的推理系统、知识表示与专家系统
3.2 连接主义:人工神经网络、分布式表示与深度学习
3.3 行为主义:强化学习、自适应系统与具身智能
3.4 统计学习学派:概率图模型、核方法与集成学习
3.5 现代融合趋势:神经符号系统、多范式集成与统一智能理论
模块二:人工智能的数学与计算基础
第4章:线性代数与优化基础
4.1 向量空间与线性变换:在特征表示中的应用
4.2 矩阵运算与张量计算:GPU加速与并行化原理
4.3 特征分解与奇异值分解:主成分分析与数据降维
4.4 优化理论基础:凸优化、梯度下降与收敛性分析
4.5 约束优化与拉格朗日乘子法:支持向量机的数学基础
第5章:概率论与信息论
5.1 随机变量与概率分布:高斯分布、伯努利分布及其混合
5.2 贝叶斯概率与统计推断:先验、后验与共轭先验
5.3 马尔可夫过程与隐马尔可夫模型:序列建模基础
5.4 信息论核心概念:熵、互信息与KL散度
5.5 信息论在机器学习中的应用:正则化、特征选择与模型比较
第6章:计算基础与算法
6.1 计算复杂度理论:P、NP、NP完全问题的实际意义
6.2 动态规划与贪心算法:在序列对齐与优化中的应用
6.3 数值计算稳定性:浮点误差、病态条件与数值微分
6.4 并行与分布式计算基础:SIMD、GPU架构与分布式训练
6.5 近似算法与启发式搜索:解决NP难问题的工程方法
模块三:机器学习核心原理
第7章:机器学习基础
7.1 机器学习基本框架:数据、假设空间、学习算法与评估
7.2 学习范式的分类:监督、无监督、半监督、自监督与强化学习
7.3 模型评估方法论:训练集、验证集、测试集划分策略
7.4 性能度量指标:准确率、精确率、召回率、F1分数、AUC-ROC
7.5 偏差-方差分解与权衡:欠拟合与过拟合的系统分析
7.6 正则化技术:L1/L2正则化、早停法与Dropout原理
第8章:经典监督学习模型
8.1 线性模型扩展:多项式回归、岭回归与LASSO回归
8.2 逻辑回归与广义线性模型:连接函数与最大似然估计
8.3 支持向量机深入:软间隔、对偶问题与核技巧
8.4 决策树算法:ID3、C4.5、CART与剪枝策略
8.5 集成学习方法:Bagging、Boosting、Stacking原理与实现
8.6 贝叶斯分类器:朴素贝叶斯、高斯过程分类
第9章:无监督学习与概率图模型
9.1 聚类算法全览:K-means、层次聚类、DBSCAN与谱聚类
9.2 降维技术对比:PCA、LDA、t-SNE、UMAP与自编码器
9.3 密度估计方法:核密度估计与混合模型
9.4 概率图模型基础:贝叶斯网络、马尔可夫网络与条件独立性
9.5 推断算法:变量消除、信念传播与采样方法
9.6 主题模型:潜在狄利克雷分布及其变体
模块四:深度学习与表示学习
第10章:神经网络基础
10.1 从生物神经元到人工神经元:激活函数进化史
10.2 多层感知机:万能近似定理与深度重要性
10.3 反向传播算法:计算图、链式法则与自动微分
10.4 优化算法演进:SGD、Momentum、Adam与自适应方法
10.5 初始化策略:Xavier、He初始化与正交初始化
10.6 批归一化与层归一化:内部协变量偏移问题解决
第11章:卷积神经网络
11.1 卷积运算本质:稀疏连接、参数共享与平移等变性
11.2 CNN经典架构分析:LeNet、AlexNet、VGG、Inception、ResNet
11.3 现代CNN变体:DenseNet、MobileNet、EfficientNet、Vision Transformer
11.4 计算机视觉任务专用网络:目标检测(R-CNN系列、YOLO系列)、语义分割(FCN、U-Net)、实例分割(Mask R-CNN)
11.5 注意力机制在视觉中的应用:SENet、Non-local Networks
11.6 CNN的可视化与解释:特征可视化、CAM、Grad-CAM
第12章:循环神经网络与序列建模
12.1 循环神经网络基础:Elman网络、双向RNN与深度RNN
12.2 长短期记忆网络:门控机制、细胞状态与梯度流动
12.3 门控循环单元:简化LSTM与计算效率
12.4 编码器-解码器架构:机器翻译的历史性突破
12.5 注意力机制革命:Bahdanau注意力与Luong注意力
12.6 Transformer架构详解:自注意力、多头注意力与位置编码
12.7 现代序列模型:BERT、GPT系列、T5等预训练语言模型
第13章:生成模型与自监督学习
13.1 生成对抗网络基础:极小极大博弈、训练稳定性与模式崩溃
13.2 GAN变体:DCGAN、WGAN、CycleGAN、StyleGAN
13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩
13.4 流模型:可逆变换与精确似然计算
13.5 扩散模型:前向过程、反向过程与得分匹配
13.6 自监督学习范式:对比学习、预测任务与掩码语言建模
13.7 多模态生成模型:CLIP、DALL-E、Stable Diffusion原理
模块五:核心问题与前沿挑战
第14章:可解释AI与因果推断
14.1 可解释AI的必要性:高风险领域需求与法规要求
14.2 模型内在可解释性:线性模型、决策树与注意力权重
14.3 事后解释方法:LIME、SHAP、积分梯度与反事实解释
14.4 因果推理基础:潜在结果框架、结构因果模型与do-演算
14.5 因果发现方法:PC算法、基于约束与基于分数的学习
14.6 因果推断应用:消除混淆偏差、个体化处理效应估计
第15章:人工智能的鲁棒性与安全性
15.1 对抗样本现象:白盒攻击、黑盒攻击与物理世界攻击
15.2 对抗防御技术:对抗训练、输入转换与认证防御
15.3 模型不确定性量化:贝叶斯神经网络、蒙特卡洛Dropout与集成方法
15.4 分布外检测:异常检测、新颖性检测与领域适应
15.5 AI安全全景:数据投毒、模型窃取、成员推断与后门攻击
15.6 隐私保护技术:差分隐私、同态加密与联邦学习
第16章:人工智能伦理、治理与社会影响
16.1 算法公平性:群体公平与个体公平的定义与度量
16.2 偏见缓解技术:预处理、处理中与后处理方法
16.3 AI伦理框架:以人为本AI、可信AI与负责任AI原则
16.4 AI治理体系:国际规范、国家立法与行业自律
16.5 AI的社会经济影响:劳动力市场变革、教育体系适应与不平等问题
16.6 AI的长期风险:价值对齐、控制问题与超级智能治理
模块六:开发实现与工程应用
第17章:AI工程化全流程
17.1 数据工程完整流程:采集、清洗、标注、增强与版本管理
17.2 特征工程系统性方法:特征构造、选择与跨模态融合
17.3 深度学习框架深入:PyTorch动态图与TensorFlow静态图对比
17.4 模型训练基础设施:分布式训练、混合精度训练与梯度检查点
17.5 超参数优化方法:网格搜索、随机搜索、贝叶斯优化与种群方法
17.6 实验管理与追踪:MLflow、Weights & Biases与DVC工具链
第18章:模型部署与运维
18.1 模型格式与转换:ONNX标准、模型序列化与框架互操作
18.2 模型压缩技术深入:结构化剪枝、量化感知训练与低秩分解
18.3 模型部署模式对比:微服务、无服务器与边缘部署架构
18.4 推理优化技术:模型编译(TVM、TensorRT)、算子融合与内存优化
18.5 MLOps实践:持续集成/持续部署流水线、模型监控与漂移检测
18.6 大规模推理系统:批处理优化、多模型服务与自动扩展
第19章:嵌入式人工智能:边缘计算与端侧智能
19.1 嵌入式AI核心范式与约束分析
- 边缘计算架构:云端协同、边缘节点与端侧设备的层次划分
- 资源约束量化:算力(TOPS/mW)、内存(KB-MB级)、功耗(mW-W级)与成本
- 实时性要求:延迟保证、确定性响应与任务关键系统
19.2 嵌入式硬件平台全景
- 微控制器级:ARM Cortex-M/R/A系列、RISC-V架构与TinyML
- 边缘计算单元:NVIDIA Jetson系列、英特尔Movidius、华为昇腾Atlas
- 专用AI加速器:谷歌Edge TPU、苹果神经引擎、高通AI引擎
- 可编程逻辑:FPGA动态重配置与ASIC定制芯片
19.3 面向嵌入式的模型轻量化技术体系
- 高效神经网络架构设计:深度可分离卷积、通道混洗与神经架构搜索
- 高级模型压缩技术:结构化剪枝算法、混合精度量化与知识蒸馏变体
- 硬件感知优化:内存访问模式优化、计算图调度与指令级并行
19.4 嵌入式AI开发工具链与工作流
- 框架支持:TensorFlow Lite完整生态、PyTorch Mobile与ONNX Runtime Micro
- MCU专用工具链:TensorFlow Lite Micro、CMSIS-NN与MicroTVM
- 开发部署全流程:模型转换与量化 → 目标平台编译 → 性能分析与调试
- 仿真与测试:硬件在环仿真、功耗分析与鲁棒性验证
19.5 嵌入式AI应用实践案例
- 案例一:基于ARM Cortex-M4的语音关键词检测系统
- 案例二:Jetson Nano上的实时多目标跟踪与行为分析
- 案例三:工业物联网边缘设备上的振动异常检测与预测性维护
- 案例四:低功耗摄像头上的始终在线感知与隐私保护计算
第20章:专项应用领域深度剖析
20.1 计算机视觉应用体系
- 工业视觉:缺陷检测、精密测量与机器人引导
- 医疗影像:疾病筛查、病灶分割与治疗规划
- 自动驾驶:感知、预测、规划与控制的全栈技术
- 增强现实:SLAM、三维重建与虚实融合
20.2 自然语言处理应用生态
- 文本理解:情感分析、信息抽取与文本分类
- 文本生成:摘要生成、内容创作与对话系统
- 大语言模型应用:提示工程、检索增强生成与智能体构建
- 多语言与低资源语言处理:跨语言迁移与少样本学习
20.3 语音与音频智能系统
- 语音识别前沿:端到端模型、自监督预训练与个性化适应
- 语音合成技术:神经声码器、情感语音与个性化语音克隆
- 音频场景分析:事件检测、声源分离与音频生成
20.4 推荐系统与计算广告
- 推荐算法演进:协同过滤、深度学习与强化学习推荐
- 大规模推荐系统架构:召回、排序、重排与实时更新
- 计算广告技术:竞价机制、点击率预测与归因分析
20.5 科学智能前沿
- AI for Science方法论:物理信息神经网络、符号回归与生成模型
- 生物医学应用:蛋白质结构预测、药物发现与基因组学
- 材料科学:新材料设计、性能预测与合成规划
- 气候与环境科学:气候建模、极端天气预测与碳中和优化
模块七:前沿拓展与综合实践
第21章:前沿研究方向选讲
21.1 强化学习进阶
- 深度强化学习算法:DQN变体、策略梯度方法与演员-评论家架构
- 多智能体系统:合作、竞争与混合动机环境
- 模仿学习与逆强化学习:从演示中学习与奖励函数推断
21.2 大语言模型与基础模型
- 缩放定律与涌现能力:模型规模、数据量与计算量的关系
- 大模型训练技术:三维并行、混合精度与内存优化
- 大模型生态:开源与闭源模型、微调方法与部署挑战
21.3 具身智能与机器人学习
- 感知-行动循环:多模态感知、世界模型与运动控制
- 机器人学习范式:仿真到现实迁移、示范学习与强化学习
- 人机交互与协作:意图理解、安全交互与协同任务完成
21.4 神经符号集成
- 符号与亚符号融合:逻辑神经网络、可微分逻辑与推理
- 知识增强学习:外部知识库整合与常识推理
- 可解释推理系统:神经定理证明与符号归纳

被折叠的 条评论
为什么被折叠?



