哈喽大家好!很久都没有更新大模型这块的书了,今天呢给大家推荐几本大模型的学习书籍!
01 ▊《大语言模型:基础与前沿》
先说一下这本:《大语言模型:基础与前沿》,本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用,涵盖大语言模型的广泛主题,从基础到前沿,从方法到应用,涉及从方法论到应用场景方方面面的内容。

作者简介
熊涛,美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家,在人工智能的多个领域,包括大语言模型、图神经网络等从事研发和管理工作多年。
适宜人群
本书内容全面、系统性强,适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。

02 ▊《从头开始构建大型语言模型序》
《从头开始构建大型语言模型》这本书,本书的内容特色在于,它不仅提供了构建LLM的全面技术指导,还深入解释了LLM的工作原理,帮助读者理解这些模型背后的机制。
此外,书中还包含了构建数据加载管道、组装LLM内部构建块以及微调技术等实践技巧。

本书作者Sebastian Raschka,是一位在机器学习和AI领域拥有超过十年经验的研究者。他曾分别在威斯康星大学麦迪逊分校统计系担任助理教授,专注于深度学习和机器学习研究, 并在2022年加入了Lightning AI,致力于AI和LLM的研究工作。Sebastian以他的畅销书和对开源软件的贡献而闻名,他对于教育和知识的传播充满了热情。
读者将跟随作者的引导,逐步将自己的基础模型转变为文本分类工具,甚至是遵循对话指示的聊天机器人。
03 ▊《大规模语言模型:从理论到实践》
张奇,桂韬,郑锐,黄萱菁 著
- 解码大语言模型奥秘,引领机器智能新时代
- 详细介绍构建LLM的四个主要阶段:预训练、有监督微调、奖励建模和强化学习
- 解读ChatGPT背后的核心技术
- 配全书PPT课件

04 ▊《LangChain入门指南:构建高可复用、可扩展的LLM应用程序》
李特丽 康轶文 著
- 全面介绍LangChain技术
- 逐步构建自己的LLM应用程序
- 内容注重高可复用性和可扩展性
- 实用案例和示例代码助你快速上手
- 与社区互动,共享经验与解决难题
本书由LangChain中文网联合创始人李特丽与创始人康轶文共同编著!


1万+

被折叠的 条评论
为什么被折叠?



