前言
各位读者朋友们,相信你一定还记得,在各大平台AI大模型图书推荐榜单中,《大规模语言模型:从理论到实践》一书始终位居排行榜前列,在2023年末那个时间点,这本书是少有的把大模型相关技术系统汇总整理,既有理论又有实践的。
时隔不到两年,大语言模型领域的发展可谓突飞猛进,大语言模型的能力在多个方面实现了显著突破,在推理能力、上下文理解深度及多模态处理能力等方面取得了长足进步。特别是在 2024 年 12 月,DeepSeek-V3的发布,以及 2025 年 1 月 DeepSeek-R1 的问世,更是引发了国内外的广泛关注和强烈反响,我国在大语言模型领域取得了新的里程碑式进展。
与此同时,大语言模型在理论研究、预训练方法、后训练技术及解释性等方面也取得了重要进展。业界对大语言模型的研究更加深入,逐渐揭示出许多与传统深度学习和自然语言处理范式不同的特点。
例如,大语言模型仅需 60 条数据就能学习并展现出强大的问题回答能力,显示了其惊人的泛化性。然而,本书作者们也发现大语言模型存在一定的脆弱性。例如,在一个拥有 130 亿个参数的模型中,仅修改一个特定参数,就可能导致模型完全丧失生成有意义信息的能力。
这些发现促使本书的作者 “复旦大学NLP团队”张奇、桂韬、郑锐、黄萱菁 几位老师对本书第 1 版进行修订升级,补充最新的研究成果和技术内容。
《大规模语言模型:从理论到实践(第2版)》的出版上市,希望可以让读者快速掌握大语言模型的研究与应用,更好地应对相关技术挑战,为推动这一领域的进步贡献力量。
新增50%以上全新内容
《大规模语言模型:从理论到实践(第2版)》除对大语言模型的构建进行深入解析外,还进一步对如何增强大语言模型的能力、如何提升大模型的效率,以及如何将大语言模型应用于实际场景进行了深入讨论。
内容涵盖多模态大语言模型、大模型智能体、检索增强生成、大语言模型效率优化、大语言模型评估和大语言模型应用开发等多个热门方向,全面展示了当前大语言模型在不同领域的最新进展与应用潜力。
在本书第 1 版的基础上添加了 4 章全新内容,同时对其他章节进行了大量修订和重写。
- 新增内容覆盖MOE、多模态、智能体、RAG、大模型效率优化、预训练、指令微调、强化学习、对齐、评估、应用开发等多方面。
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

目录
第1章 绪论1
- 1.1 大语言模型的基本概念1
- 1.2 大语言模型的发展历程4
- 1.3 大语言模型的构建流程8
- 1.4 本书的内容安排10
第2章 大语言模型基础13
- 2.1 Transformer结构13
- 2.2 生成式预训练语言模型GPT 25
- 2.3 大语言模型的结构32
- 2.4 混合专家模型46
- 2.5 实践思考51
第3章 大语言模型预训练数据52
- 3.1 数据来源52
- 3.2 数据处理56
- 3.3 数据影响分析64
- 3.4 开源数据集70
- 3.5 实践思考82
第4章 分布式训练83
- 4.1 分布式训练概述83
- 4.2 分布式训练的并行策略85
- 4.3 分布式训练的集群架构103
- 4.4 DeepSpeed实践110
- 4.5 实践思考126
第5章 指令微调127
- 5.1 指令微调训练127
- 5.2 高效模型微调144
- 5.3 模型上下文窗口扩展150
- 5.4 DeepSpeed-Chat SFT实践153
- 5.5 实践思考162
第6章 强化学习164
- 6.1 强化学习概述164
- 6.2 策略梯度方法168
- 6.3 推理模型的强化学习179
- 6.4 基于人类反馈的强化学习185
- 6.5 verl实践191
- 6.6 实践思考199
第7章 多模态大语言模型200
- 7.1 多模态大语言模型基础200
- 7.2 大语言模型与多模态融合架构205
- 7.3 多模态大语言模型训练策略217
- 7.4 MiniGPT-4实践222
- 7.5 实践思考229
第8章 大模型智能体231
- 8.1 智能体基础231
- 8.2 大模型智能体架构235
- 8.3 大模型智能体训练241
- 8.4 大模型智能体实践252
- 8.5 实践思考279
第9章 检索增强生成280
- 9.1 检索增强生成基础280
- 9.2 Modular RAG架构287
- 9.3 RAG系统设计模式301
- 9.4 RAG系统优化306
- 9.5 RAG系统评估316
- 9.6 RAG实践324
- 9.7 实践思考328
第10章 大语言模型效率优化330
- 10.1 效率优化基础330
- 10.2 模型优化334
- 10.3 低精度训练345
- 10.4 高效推理351
- 10.5 vLLM推理框架实践358
- 10.6 实践思考361
第11章 大语言模型评估362
- 11.1 模型评估概述362
- 11.2 大语言模型评估体系364
- 11.3 大语言模型评估方法376
- 11.4 大语言模型评估实践386
- 11.5 实践思考399
第12章 大语言模型应用开发401
- 12.1 大语言模型典型应用场景401
- 12.2 大语言模型应用开发案例408
- 12.3 大语言模型本地部署实践413
- 12.4 实践思考420
参考文献422
索引451
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇
