目前我见过的最好的两本LLM大模型入门书!一本国内人大发表!一本国外出版两个月GitHub星标已狂飙到37.6K!

现在大模型毫无疑问依旧是目前最前沿、就业市场最广的方向,今天给大家推荐两本我目前看到最适合初学者用来入门到进阶的大模型书,其实之前也都有推荐过,但最近还是有很多新粉来问,那我就写篇文章再次汇总推荐一下!

这两本书的电子版PDF与配套代码可以直接扫码添加我的助手让她无偿及时发送给你!

第一本:中国人民大学发表的《大语言模型》

这本书是由人大之前发表且当时大火过的[A Survey of Large Language Models]综述重组、修改、添加、整理后发表出来的!这篇综述目前迭代了15次!GitHub星标近11K!

 

这本书主要就是为初学者设计的,可以给你提供非常完善的大模型技术路线框架,帮你系统正确的进入到大模型领域。

这本书对大模型技术的基础知识、大模型资源、数据、模型架构、预训练、指令微调、人类对齐、解码与部署、提示学习、规划与智能体、应用等方面都进行非常详尽的解读。

甚至因为这本书还开发了一个非常全面的代码工具库,专门用来开发和实现大语言模型,有训练和利用大语言模型的一站式解决方案,可以实现训练和利用阶段高度的灵活性和效率。

 

第二本:《带你从零构建大模型》

这位威斯康星大学麦迪逊分校的终身教授塞巴斯蒂安撰写的从零开始构建大模型的入门书。虽然是今年的10月份才正式出版,但在github上的星标已经达到了离谱的37.6k了!非常非常受欢迎!

这本书的目的在于从理论和代码层面动手带你从零一步步构建属于自己的大语言模型,整本书的每个阶段都充斥着清晰的文本、图表和示例解释,涵盖了从初始设计和创建到在通用语料库上的预训练,再到针对特定任务的微调。

第一章是带你通透的理解大语言模型,像大语言模型背后的基本概念、类似chatgpt类的大模型的transformer结构,然后开始规划如何从零构建大语言模型。后面的章节就是使用文本数据、编码注意力机制、从头开始实现gpt模型以生成文本、未标记数据的预训练、文本分类的微调、按照指令进行微调。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI大模型coke

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值