大模型入门必读的9本书籍汇总
NO.1:《基于GPT-3,ChatGPT,GPT-4等Transformer架构的自然语言处理》
主要内容:
- 了解用于解决复杂语言问题的新技术。
- 将GPT-3与T5、GPT-2和基于BERT的Transformer的结果进行对比。
- 使用TensorFlow、PyTorch和GPT-3执行情感分析、文本摘要、非正式语言分析、机器翻译等任务,了解VIT和CLIP如何标注图像(包括模糊化),并使用DALL-E从文本生成图像。
- 学习ChatGPT和GPT-4的高级提示工程机制”
NO.2:《大模型应用开发极简入门:基于GPT-4和ChatGPT》
主要内容:
本书为大模型应用开发极简入门手册,为初学者提供了一份清晰、全面的可用知识”,带领大家快速了解GPT-4和ChatGPT的工作原理及优势,并在此基础上使用流行的Python编程语言构建大模型应用。通过本书,你不仅可以学会如何构建文本生成、问答和内容摘要等初阶大模型应用,还能了解到提示工程、模型微调、插件、LangChain等高阶实践技术。书中提供了简单易学的示例,帮你理解并应用在自己的项目中。
NO.3:《大语言模型》
主要内容:
本书展现了大语言模型技术的整体框架和路线图,内容讲解力求简明、准确、实用,主要目的在于为相关行业或研究领域提供大模型技术的中文参考资料,推动我国相关人工智能技术的发展。全书共13章,内容涉及大模型的背景和基础知识、资源、预训练、微调与对齐、大模型使用以及模型评测等,同时还提供了相关的代码示例与实验工具包。 本书可供具有深度学习基础的读者阅读与使用,既可作为高等学校人工智能、大数据、计算机类等专业教材,也可作为相关研究与从业人员的参考用书。
NO.4:《AI赋能:AI重新定义产品经理》
主要内容:
随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书希望向读者提供学习A技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,给大家指出AI赋能过程中需要避免的“坑”,期待我们在AI时代共同发展自己、发展生活,在未来遇到更好的AI产品、更好的自己
NO.5:《大模型时代:ChatGPT开启通用人工智能浪潮》
主要内容:
本书对大模型时代的技术、应用和产业变化行了深的分析和阐述。本书首先将专业的技术知识通过拟人化的形式行呈现,生动形象地解释了ChatGPT大模型背后的原理;其次,本书以三次工业革命的历史和逻辑作为参照,描绘出大模型将如何驱动社会智能革命和脑机协作时代,并为个人和企业应对此次变革提出建议;第三,本书对大模型在知识工作、商业企业、创意娱乐等领域的具体应用行介绍,对国内外大模型产业的构成和发展行了分析,并对暗藏泡沫隐患的风险位做出预警
NO.6:《GPT图解:大模型是怎样构建的》
主要内容:
人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理O(NLP)技术的深奥秘境。该书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络)Seq2Seq(s2s),注意力机制,Transformer,从初代GPT到ChatGPT再到GPT-4等一系列突破性技术的诞生与演进。
NO.7:《从零开始大模型开发与微调:基于PyTorch与chatGLM》
主要内容:
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前A和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。
NO.8:《大语言模型:基础与前沿》
主要内容:
这本书相比市场上同类型书籍,在内容上更具有稀缺性,因为它不仅讲解了当前LLM技术的原理与应用,还展望了未来的发展方向,更对其争议也进行了思辨,帮助读者找到技术与现实应用的最佳结合点。本书最大的特点就是全面性,通过对LLM的基础知识、前沿进展和社会影响的解读,为读者提供了系统的认识。
NO.9:《动手做AI Agent》
主要内容:
人工智能时代一种全新的技术Agent正在崛起。这是一种能够理解自然语言并生成对应回复以及执行具体行动的人工智能体。它不仅是内容生成工具,而且是连接复杂任务的关键纽带。本书将探索Agent的奥秘,内容包括从技术框架到开发工具,从实操项目到前沿进展,通过带着读者动手做7个功能强大的Agent,全方位解析Agent的设计与实现。本书最后展望了Agent的发展前景和未来趋势。