提示:此路线获取自网络,经历了多次更新和完善,可系统掌握从基础编程到前沿大模型的全栈技能,并具备解决问题的能力。
注:作者正在亲测中,学习期间的心得体会也会不定期更新,敬情关注。
一、编程基础与Python核心
1.1 Python语言基础
- 核心内容:
- 变量、数据类型、运算符、流程控制(if/while/for)
- 字符串操作、容器(列表/元组/字典)
- 函数、文件操作(读写/目录管理)、异常处理
- 实战项目:
- 聊天机器人(Streamlit+LangChain)
1.2 Python进阶与高级特性
- 核心内容:
- 面向对象编程(类/对象/继承)
- 闭包、装饰器、生成器、正则表达式
- 网络编程(TCP/Socket)、多线程/进程
- 学习目标:
- 实现网络通信程序,掌握多任务编程。
二、数据分析与工程化基础
2.1 Linux与SQL
- 核心内容:
- Linux命令(文件管理/权限/vi编辑器)
- MySQL基础(增删改查、分组聚合、多表查询)
- 学习目标:
- 熟练操作Linux服务器,独立完成数据库设计与查询。
2.2 数据分析工具链
- 核心内容:
- Numpy(数组运算/矩阵操作)
- Pandas(数据清洗/ETL/透视表)
- 数据可视化(Matplotlib/Seaborn)
- 实战项目:
- RFM用户价值分析(数据分组/可视化/业务解读)
三、机器学习与模型开发
3.1 机器学习基础
- 核心内容:
- 算法原理:KNN、线性回归、逻辑回归、决策树、集成学习(随机森林/XGBoost)
- 模型评估(分类/回归指标)、超参数调优
- 实战项目:
- 电力负荷预测(时序预测案例)
3.2 深度学习基础
- 核心内容:
- PyTorch框架(张量运算/自动梯度/数据加载)
- 神经网络(激活函数/反向传播/优化器)
- CNN(卷积层/池化层)、RNN(词嵌入/文本生成)
- 实战项目:
- CIFAR-10图像分类、基于RNN的文本生成
四、自然语言处理(NLP)
4.1 NLP基础技术
- 核心内容:
- 文本处理(分词/命名实体识别)
- 词向量(Word2Vec/FastText)
- 序列模型(LSTM/GRU/Attention)
- 实战项目:
- 人名分类器、Seq2Seq英译法模型
4.2 预训练与迁移学习
- 核心内容:
- Transformer架构(编码器/解码器)
- BERT微调、FastText文本分类
- 模型压缩(量化/剪枝/蒸馏)
- 实战项目:
- 中文分类/填空/句子关系迁移学习案例
五、大模型开发与应用
5.1 大模型基础与工具链
- 核心内容:
- 主流大模型(ChatGPT/ChatGLM/LLaMA)
- LangChain框架(模型集成/文档检索)
- RAG检索增强生成、Prompt工程
- 实战项目:
- 物流知识库问答机器人、金融文本分类
5.2 大模型微调与部署
- 核心内容:
- LoRA/P-Tuning微调技术
- 模型蒸馏、GPTQ量化、vLLM推理优化
- 实战项目:
- 微博多任务信息抽取、头条新闻分类(DeepSeek/QWen)
六、综合项目实战
6.1 垂直领域项目
- 核心项目:
- 医疗知识图谱(Neo4j+实体抽取/关系抽取)
- 新零售评价系统(BERT+P-Tuning/PET方法)
- 虚拟试衣系统(扩散模型+控制因子融合)
6.2 多模态与AIGC
- 核心内容:
- Stable Diffusion图像生成(LoRA/DreamBooth)
- 类Sora视频生成(时空建模/文生视频)
- 实战项目:
- 图像生成小程序、视频修复与风格迁移
七、扩展领域(选修)
7.1 计算机视觉
- 核心内容:
- 图像分类(ResNet)、目标检测(YOLO)
- 图像分割(Mask R-CNN)
- 实战项目:
- 基于PyTorch的图像分类器
7.2 AI Agent开发
- 核心内容:
- Function Call(天气查询/数据库操作)
- GPTs/Assistant API(答疑机器人)
- 实战项目:
- 自动邮件发送Agent(CrewAI框架)
八、学习路线执行建议
1. 阶段顺序:
按编程基础→数据分析→机器学习→深度学习→NLP→大模型→综合项目逐步推进,确保前置知识扎实。
2. 时间分配:
- 基础阶段(1-2月):Python+数据分析
- 进阶阶段(2-3月):机器学习+深度学习
- 高阶阶段(3-4月):NLP+大模型+项目实战
3. 实践优先:
每个技术模块需搭配至少1个实战项目,优先完成文档中列出的核心项目(如聊天机器人、医疗图谱)。
---
技术栈总结
领域 | 核心工具/框架 |
编程语言 | Python、SQL |
数据分析 | Pandas、Numpy、Matplotlib |
机器学习 | Scikit-learn、XGBoost |
深度学习 | PyTorch、TensorFlow |
NLP与大模型 | Hugging Face、LangChain、ChatGLM |
多模态 | Stable Diffusion、DALL·E |
部署与优化 | vLLM、ONNX、模型量化工具(GPTQ) |