在人工智能领域,大模型(LLM)无疑是当下最炙手可热的话题之一。从改变人们交互方式的 ChatGPT,到各行各业基于大模型开发的创新应用,LLM 正以迅猛之势重塑科技生态与产业格局。
在这样的大背景下,想要深入了解大语言模型的理论基础、核心算法以及工程实践方法,就需要一本专业且全面的书籍作为指引,而《大规模语言模型:从理论到实践(第 2 版)》正是这样一本不可多得的佳作。

本书共分为12章,围绕大语言模型基础理论、预训练、指令理解、大模型增强和大模型应用五个部分展开。
第1部分:介绍大语言模型的基础理论。
第2部分:介绍大语言模型的预训练,包括大语言模型预训练数据和分布式训练。
第3部分:介绍大语言模型如何理解并服从人类指令,包括指令微调和强化学习。
第4部分:介绍大语言模型增强技术,包括多模态大语言模型、大模型智能体和检索增强生成。
第5部分:介绍大模型应用,包括大语言模型效率优化、大语言模型评估和大语言模型应用开发。
除了大语言模型的构建,这本书还进一步介绍了大语言模型的应用和评估方法,包括如何将大语言模型与外部工具和知识源进行连接、如何利用大语言模型进行自动规划完成复杂任务,以及针对大语言模型的各类评估方法。
课程目录如下:





这本书为大语言模型感兴趣的读者提供一个入门指南,也可作为高年级本科生和研究生自然语言处理相关课程的大语言模型部分的补充教材。
感兴趣的话,或者需要更多完整资料,电子书、教程视频、项目源代码请移步,

3033

被折叠的 条评论
为什么被折叠?



