现在大模型毫无疑问依旧是目前最前沿、就业市场最广的方向,今天给大家推荐两本我目前看到最适合初学者用来入门到进阶的大模型书,其实之前也都有推荐过,但最近还是有很多新粉来问,那我就写篇文章再次汇总推荐一下!
这两本书的电子版PDF与配套代码可以直接扫码添加我的助手让她无偿及时发送给你!
第一本:中国人民大学发表的《大语言模型》
这本书是由人大之前发表且当时大火过的[A Survey of Large Language Models]综述重组、修改、添加、整理后发表出来的!这篇综述目前迭代了15次!GitHub星标近11K!
这本书主要就是为初学者设计的,可以给你提供非常完善的大模型技术路线框架,帮你系统正确的进入到大模型领域。
这本书对大模型技术的基础知识、大模型资源、数据、模型架构、预训练、指令微调、人类对齐、解码与部署、提示学习、规划与智能体、应用等方面都进行非常详尽的解读。
甚至因为这本书还开发了一个非常全面的代码工具库,专门用来开发和实现大语言模型,有训练和利用大语言模型的一站式解决方案,可以实现训练和利用阶段高度的灵活性和效率。
第二本:《带你从零构建大模型》
这位威斯康星大学麦迪逊分校的终身教授塞巴斯蒂安撰写的从零开始构建大模型的入门书。虽然是今年的10月份才正式出版,但在github上的星标已经达到了离谱的37.6k了!非常非常受欢迎!
这本书的目的在于从理论和代码层面动手带你从零一步步构建属于自己的大语言模型,整本书的每个阶段都充斥着清晰的文本、图表和示例解释,涵盖了从初始设计和创建到在通用语料库上的预训练,再到针对特定任务的微调。
第一章是带你通透的理解大语言模型,像大语言模型背后的基本概念、类似chatgpt类的大模型的transformer结构,然后开始规划如何从零构建大语言模型。后面的章节就是使用文本数据、编码注意力机制、从头开始实现gpt模型以生成文本、未标记数据的预训练、文本分类的微调、按照指令进行微调。