中国人大在收录900余篇参考文献,迭代13个版本后,终于出版了这本大模型中文版!
与英文综述文章定位不同,这本书更注重为初学者提供关于大模型技术的全面了解,是专门为深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的技术书籍
书籍的PDF已经下载打包好了,以及这100篇大模型优质论文,都可以无偿分享给你!
这些都是无偿分享的
扫描二维码添加小助手自取即可
通过本书可以了解到大模型的最新进展和技术体系,书籍的内容共分为了五个部分,第一部分基础,介绍了一些目前主流的大模型发展历程和技术,例如Scaling Law、GPT系列
第二部分预训练,讲解了数据收集、清洗、配比、大模型主流架构、预训练任务、优化参数设置等,带你从头搭建大模型
第三部分微调与对齐,概括了指令数据与合成方法、指令微调策略与作用、RLHF算法等
第四部分大模型使用,讲解了各种算法和方法,例如解码生成算法、解码加速算法、模型压缩算法基础提示方法、上下文学习、思维链复杂规划方法、智能体搭建方法
第五部分测评与应用,说明了各种评估大模型性能的指标和方法
为了让读者更好的理解,还专门创建了一个大模型代码工具库,专门用于开发和实现大语言模型,这样一份大模型学习指南谁不爱呢!