一、前置知识
编程语言(核心推荐 Python)
从主流招聘网站岗位需求来看,Python 已成为大模型应用开发的首选语言。掌握 Python 编程基础是核心,同时需熟练使用 Anaconda(环境管理)、PyCharm/Jupyter/VSCode(开发工具)。Java 编程基础作为拓展可选,而 Linux 基础(环境搭建、基本命令操作)则是必备技能,有助于后续模型部署与服务器管理。
AI 相关概念与应用场景(基础认知)
- 机器学习与深度学习:深度学习是机器学习的分支,二者核心差异及应用场景。
- 自然语言处理(NLP):文本处理、对话系统等领域应用。
- 计算机视觉(CV):图像识别、目标检测等方向。
- 语音识别和合成(ASR、TTS):语音交互技术实现原理。
- 推荐系统:个性化推荐逻辑与算法。
- 机器人:AI 技术在机器人控制中的应用。
二、大模型应用基础
基础认知
- 大模型起源与发展:从早期神经网络到当前大模型的演进路径,以及大模型与 AI 整体发展的关系。
- 关键名词解析:AGI(通用人工智能)、AIGC(生成式人工智能)等核心概念定义与内涵。
主流大模型及分类
- 国外:GPT(OpenAI)、Llama(Meta)、Gemini(Google)、Claude(Anthropic)的技术特点与应用场景。
- 国内:DeepSeek、Qwen(阿里)、文心(百度)、GLM(智谱 AI)的优势与适用领域。
- 模型分类:语言大模型、视觉大模型、多模态大模型、嵌入模型等不同类型的核心差异。
- 模型格式:常见模型文件格式GGUF、ONNX介绍及其应用场景。
硬件基础
- GPU 与 CPU 区别:GPU 在并行计算上的优势及大模型训练中的作用。
- CUDA 核心:CUDA 架构对 GPU 计算能力的影响。
- 显存管理:大模型训练中的显存优化策略。
- 模型精度:FP16、FP32、int8、int4 等精度的选择与应用场景。
提示词工程
- Prompt 核心作用:提示词对模型输出的重要性及影响。
- 模型差异:通用模型与推理模型在 Prompt 设计上的不同策略。
- Prompt 构成:角色设定、目标明确、方案规划、输出格式要求。
- 调优技巧:提升 Prompt 效果的实用方法。
- 攻击与防范:Prompt 攻击原理及防御措施。
Hugging Face/Model Scope 使用
介绍两大平台在模型下载、训练、部署中的便捷功能与操作流程。
三、大模型主流开发框架
LangChain
- 模型 IO 操作:与不同模型的数据交互方法。
- 链架构:Chains 的构建逻辑与 LCEL 表达式的使用。
- Memory 记忆功能:实现对话历史记录与上下文理解。
- 智能体 Agent 实现:Agent 构建与运行机制。
- RAG 实现:从数据加载到向量存储的完整流程。
LangChain4J(仅Java生态需学)
对比 LangChain,说明其在 Java 环境下的使用特点。
SpringAI & SpringAI Alibaba(仅Java生态需学)
介绍基于 Spring 框架的大模型开发优势与应用场景。
四、RAG 开发
嵌入模型
- 基本概念与原理:嵌入模型将数据转化为向量表示的核心逻辑。
- 常见嵌入技术
- 词嵌入:Word2Vec、GloVe、FastText 的算法特点与应用。
- 文本嵌入:BERT、GPT 在文本处理中的嵌入方法。
- 图片和音频嵌入:多模态数据的嵌入技术。
- 特征嵌入:结构化数据的向量转化策略。
向量存储
- 向量数据库:向量存储与检索原理,Milvus、Chroma 等数据库对比与操作。
- 向量存储应用:文本、图片等数据的向量存储实现。
RAG 概述
- 核心概念:RAG(检索增强生成)解决的实际问题与优势。
- 工作原理:从检索到生成的完整流程解析。
LlamaIndex 框架
- 核心工具:DataConnectors、Data Indexes 等组件的功能与使用。
- 索引与查询阶段:详细操作流程与优化策略。
RAG 流程
- 数据准备:数据提取、分割、向量化及存储全流程。
- 检索生成阶段:问题处理、数据检索、答案生成的详细步骤。
- Rerank阶段:Rerank模型,Rerank原理
RAG 进阶
- RAG 演进:从 NaiveRAG 到 AdvancedRAG、ModularRAG 的技术升级。
- GraphRAG 与 AgenticRAG:结合知识图谱与智能体的 RAG 拓展应用。
五、Agent 开发
Agent 概念
- 定义与作用:智能体在大模型应用中的功能定位。
- 基本架构:规划、记忆、工具、执行四大模块的协同运作。
- 工具调用:Funcation calling、React 等调用机制。
WorkFlow
- 工作流基础:工作流的定义与在 Agent 系统中的作用。
- 流程搭建:工作流设计与实现方法。
- 优化策略:提升工作流效率的实用技巧。
Agent 系统
- 多 Agent 与单 Agent:二者差异及多 Agent 系统优势。
- MetaGPT:介绍 MetaGPT 的特点与应用场景。
LangGraph 框架
- 基础使用:构建多 Agent 系统的操作步骤。
- 核心概念:图结构、检查点、工具调用等关键概念解析。
六、微调
微调基础
- 核心概念:微调在模型优化中的作用与意义。
- 与 RAG 关系:微调与 RAG 技术的协同应用场景。
- 压缩训练:量化、剪枝、蒸馏等技术原理与实践。
数据工程
- 数据采集与清洗:获取高质量数据的方法与流程。
- 数据标注与增强:提升数据可用性的策略。
- 数据集划分:训练集、验证集、测试集的科学划分方法。
微调框架
- LLama Factory:框架功能与使用教程。
- Xtuner:介绍其特色与操作流程。
微调流程
- 数据集选择:根据任务需求选择合适数据集的方法。
- 参数设置:训练参数调整与优化策略。
- 模型评估:验证微调效果的评估指标与方法。
微调进阶
- 分布式推理与训练:张量并行、流水线并行、Deep Speed等技术实现。
- 混合精度训练:提升训练效率的实用技巧。
- 模型压缩与加速:优化模型性能的常用方法。
七、工具使用
模型部署工具
- Ollama、vLLM、LMDeploy:工具特点、部署流程及对话模板设置。
Dify
- 本地部署:详细安装与配置步骤。
- 工作流配置:核心功能与操作指南。
- 聊天助手与 RAG 实现:应用案例与实践技巧。
Coze
- 工作流配置:流程设计与优化方法。
- 平台对接:实现自动化流程的应用场景。
RAGFlow
- 本地部署:环境搭建与操作流程。
- 知识库搭建:构建高效知识库的方法。
Cursor/Trae
- 基础与进阶使用:从入门到高级的功能操作指南。
八、多模态
- 模型部署:多模态模型部署的特殊要求与方法。
- 模型使用:多模态数据处理与应用场景。
九、进阶
数学基础
- 高等数学:导数、偏导、梯度在模型优化中的应用。
- 线性代数:标量、向量、矩阵运算与模型计算关系。
- 概率论:概率分布、贝叶斯定理在模型训练中的作用。
LLM 架构原理
- Transformer 架构:编码器、解码器、自注意力机制详解。
- Bert 与 GPT 对比:不同预测模式的技术差异与应用场景。
- MoE 应用:在多领域的实践案例与优势。
机器学习与深度学习
- 监督学习与无监督学习:算法原理与应用场景。
- PyTorch 与 TensorFlow:两大框架的对比与使用技巧。
ASR/TTS
- 模型部署:语音技术部署的关键步骤。
- 模型选择:根据需求选择合适模型的方法。
十、项目
AI 项目开发流程
- 需求分析:明确项目目标与用户需求的方法。
- 数据方案:数据采集、处理与管理策略。
- 模型选型:根据任务选择合适模型的原则。
- 模型训练:训练流程与优化技巧(可选)。
- 核心流程开发:项目功能实现的关键步骤。
- 效果评估:评估项目成果的指标与方法。
- 部署上线:项目部署与运维注意事项。
实战项目
- 微调项目:通过实际案例掌握微调技术。
- RAG 项目:完整 RAG 系统开发实践。
- Agent 项目:构建智能体系统的全流程操作。
1279

被折叠的 条评论
为什么被折叠?



