LLM Cookbook常见问题解答:开发者必看FAQ
LLM Cookbook作为面向开发者的大模型入门教程,基于吴恩达老师大模型系列课程中文版,覆盖从Prompt Engineering到RAG开发、模型微调的全部流程。本FAQ汇总开发者学习过程中最常见的技术问题,结合官方文档与实践经验提供解决方案,帮助开发者快速排查问题、提升学习效率。
环境配置与依赖安装
Anaconda安装与环境创建
Anaconda是本项目推荐的Python环境管理工具,可通过清华源镜像加速下载Anaconda。Windows用户建议下载.exe安装包,Mac用户根据芯片类型选择对应.sh文件:
# Apple芯片安装示例
sh Anaconda3-2023.07-1-MacOSX-arm64.sh -b
~/anaconda3/bin/conda init
创建专用环境可避免依赖冲突:
conda create --name ai_api python=3.9 -y
conda activate ai_api # 激活环境
核心依赖安装
项目依赖通过pip管理,基础安装命令:
pip install -q python-dotenv openai langchain chromadb # 核心库
pip install -r content/选修-Building and Evaluating Advanced RAG Applications/requirements.txt # 特定课程依赖
完整依赖列表可参考各课程目录下的requirements.txt,如高级RAG应用依赖。
API密钥配置与管理
OpenAI API密钥获取
- 登录OpenAI官网,进入API设置页面
- 点击"Create new secret key"生成密钥
- 保存密钥时需注意:不要截图存储,避免公开仓库提交
密钥安全配置
推荐使用.env文件管理密钥,项目根目录创建文件:
OPENAI_API_KEY="sk-..." # 替换为实际密钥
通过工具函数安全加载:
from dotenv import load_dotenv, find_dotenv
import os
def get_api_key():
_ = load_dotenv(find_dotenv()) # 自动查找.env文件
return os.environ["OPENAI_API_KEY"]
详细配置步骤见设置OpenAI_API_KEY.ipynb。
课程学习路径与资源
必修与选修课程体系
项目课程分为两类,建议学习顺序:
必修课程(掌握基础技能):
- Prompt Engineering:提示词设计原则与实践
- Chat API系统开发:对话系统架构
- LangChain应用开发:框架使用指南
- LangChain数据交互:私有数据处理
选修课程(专项能力提升):
在线阅读与PDF版本
必修课程提供在线阅读版本:
常见错误与解决方案
API调用失败
错误表现:openai.error.AuthenticationError
排查步骤:
- 检查密钥格式:应以
sk-开头,长度约51字符 - 验证余额状态:新账号需绑定支付方式
- 网络环境测试:使用
ping api.openai.com检查连通性
国内替代方案:参考其他教程修改API调用代码适配国内模型。
依赖版本冲突
错误表现:ImportError或函数参数不匹配
解决方案:
pip freeze > requirements.txt # 导出当前环境
# 对比课程要求版本,重点检查:
# langchain>=0.0.200 openai>=0.27.0 python-dotenv>=1.0.0
进阶问题与优化建议
Prompt设计原则
基础提示原则包括:
- 清晰明确:指定输出格式与长度,如"用 bullet points总结以下文本,不超过3点"
- 给模型思考时间:复杂任务使用思维链提示,如"先分析问题再给出答案,分析过程用 包裹"
详细技巧见提示原则。
模型选择策略
根据任务类型选择模型:
- 文本生成:gpt-3.5-turbo(性价比高)
- 嵌入生成:text-embedding-ada-002(通用嵌入)
- 微调任务:babbage-002(中小规模数据)
模型对比与选型指南见模型评估。
学习资源与社区支持
官方文档与示例代码
问题反馈与贡献
遇到未解决的问题可:
- 提交Issue到项目仓库
- 参与DataWhale社区讨论
- 参考贡献指南提交PR完善教程
通过系统学习必修课程与实践,开发者可掌握从基础API调用到复杂RAG系统构建的全流程技能。建议定期关注项目更新,课程内容会持续根据LLM技术发展进行优化迭代。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考






