复旦NLP团队2025新书《大规模语言模型:从理论到实践(第2版)》重磅来袭!附PDF,先到先得!!

前言

各位读者朋友们,相信你一定还记得,在各大平台AI大模型图书推荐榜单中,《大规模语言模型:从理论到实践》一书始终位居排行榜前列,在2023年末那个时间点,这本书是少有的把大模型相关技术系统汇总整理,既有理论又有实践的。

时隔不到两年,大语言模型领域的发展可谓突飞猛进,大语言模型的能力在多个方面实现了显著突破,在推理能力、上下文理解深度及多模态处理能力等方面取得了长足进步。特别是在 2024 年 12 月,DeepSeek-V3的发布,以及 2025 年 1 月 DeepSeek-R1 的问世,更是引发了国内外的广泛关注和强烈反响,我国在大语言模型领域取得了新的里程碑式进展。

与此同时,大语言模型在理论研究、预训练方法、后训练技术及解释性等方面也取得了重要进展。业界对大语言模型的研究更加深入,逐渐揭示出许多与传统深度学习和自然语言处理范式不同的特点。

例如,大语言模型仅需 60 条数据就能学习并展现出强大的问题回答能力,显示了其惊人的泛化性。然而,本书作者们也发现大语言模型存在一定的脆弱性。例如,在一个拥有 130 亿个参数的模型中,仅修改一个特定参数,就可能导致模型完全丧失生成有意义信息的能力

在这里插入图片描述

这些发现促使本书的作者 “复旦大学NLP团队”张奇、桂韬、郑锐、黄萱菁 几位老师对本书第 1 版进行修订升级,补充最新的研究成果和技术内容。

《大规模语言模型:从理论到实践(第2版)》的出版上市,希望可以让读者快速掌握大语言模型的研究与应用,更好地应对相关技术挑战,为推动这一领域的进步贡献力量。

新增50%以上全新内容

《大规模语言模型:从理论到实践(第2版)》除对大语言模型的构建进行深入解析外,还进一步对如何增强大语言模型的能力、如何提升大模型的效率,以及如何将大语言模型应用于实际场景进行了深入讨论。

内容涵盖多模态大语言模型、大模型智能体、检索增强生成、大语言模型效率优化、大语言模型评估和大语言模型应用开发等多个热门方向,全面展示了当前大语言模型在不同领域的最新进展与应用潜力。

在本书第 1 版的基础上添加了 4 章全新内容,同时对其他章节进行了大量修订和重写。

  • 新增内容覆盖MOE、多模态、智能体、RAG、大模型效率优化、预训练、指令微调、强化学习、对齐、评估、应用开发等多方面。

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

目录

1章 绪论1

  • 1.1 大语言模型的基本概念1
  • 1.2 大语言模型的发展历程4
  • 1.3 大语言模型的构建流程8
  • 1.4 本书的内容安排10

添加图片注释,不超过 140 字(可选)

2章 大语言模型基础13

  • 2.1 Transformer结构13
  • 2.2 生成式预训练语言模型GPT 25
  • 2.3 大语言模型的结构32
  • 2.4 混合专家模型46
  • 2.5 实践思考51

3章 大语言模型预训练数据52

  • 3.1 数据来源52
  • 3.2 数据处理56
  • 3.3 数据影响分析64
  • 3.4 开源数据集70
  • 3.5 实践思考82

4章 分布式训练83

  • 4.1 分布式训练概述83
  • 4.2 分布式训练的并行策略85
  • 4.3 分布式训练的集群架构103
  • 4.4 DeepSpeed实践110
  • 4.5 实践思考126

5章 指令微调127

  • 5.1 指令微调训练127
  • 5.2 高效模型微调144
  • 5.3 模型上下文窗口扩展150
  • 5.4 DeepSpeed-Chat SFT实践153
  • 5.5 实践思考162

在这里插入图片描述

6章 强化学习164

  • 6.1 强化学习概述164
  • 6.2 策略梯度方法168
  • 6.3 推理模型的强化学习179
  • 6.4 基于人类反馈的强化学习185
  • 6.5 verl实践191
  • 6.6 实践思考199

7章 多模态大语言模型200

  • 7.1 多模态大语言模型基础200
  • 7.2 大语言模型与多模态融合架构205
  • 7.3 多模态大语言模型训练策略217
  • 7.4 MiniGPT-4实践222
  • 7.5 实践思考229

8章 大模型智能体231

  • 8.1 智能体基础231
  • 8.2 大模型智能体架构235
  • 8.3 大模型智能体训练241
  • 8.4 大模型智能体实践252
  • 8.5 实践思考279

9章 检索增强生成280

  • 9.1 检索增强生成基础280
  • 9.2 Modular RAG架构287
  • 9.3 RAG系统设计模式301
  • 9.4 RAG系统优化306
  • 9.5 RAG系统评估316
  • 9.6 RAG实践324
  • 9.7 实践思考328

10章 大语言模型效率优化330

  • 10.1 效率优化基础330
  • 10.2 模型优化334
  • 10.3 低精度训练345
  • 10.4 高效推理351
  • 10.5 vLLM推理框架实践358
  • 10.6 实践思考361

在这里插入图片描述

11章 大语言模型评估362

  • 11.1 模型评估概述362
  • 11.2 大语言模型评估体系364
  • 11.3 大语言模型评估方法376
  • 11.4 大语言模型评估实践386
  • 11.5 实践思考399

12章 大语言模型应用开发401

  • 12.1 大语言模型典型应用场景401
  • 12.2 大语言模型应用开发案例408
  • 12.3 大语言模型本地部署实践413
  • 12.4 实践思考420

参考文献422

索引451

在这里插入图片描述

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值