分析一波有关RAG相关的国内外书籍。欢迎大家发表关于这些书籍的想法。
国内
-
书名:《大模型应用开发:RAG入门与实战》
-
作者:陈明明、潘翔、戴弘毅
-
发布日期:2024-10-01
-
简介:本书详细解析了RAG(Retrieval-Augmented Generation,检索增强生成)技术及其应用,从文档的分块与向量化,到利用深度学习模型进行向量检索,再到结合Prompt技术以实现精准响应,每个知识点都有清晰的逻辑阐述与实践案例;同时,介绍了PyTorch编程基础与深度学习概念。此外,本书还涵盖了一系列实用技术,如Web可视化工具Streamlit与Gradio的使用,以及如何利用这些工具快速构建交互式界面,直观展示RAG技术的效果。最后,通过动手实现PDF阅读器的实例,读者能亲自体验从理论到实践的过程,加深对RAG技术的理解与掌握。
-
受众群体:适合对文档搜索和RAG应用感兴趣的读者阅读,也可以作为从事大语言模型相关工作的人员的参考书。
-
目录:
-
RAG概述
-
Pytorch编程基础
-
深度学习基础
-
自然语言处理基础
-
Web可视化
-
RAG文档分块和向量化
-
RAG向量检索技术
-
RAG中的Prompt技术
-
动手实现PDF阅读器
-
-
个人分析
-
作家来历:
-
陈明明,数据科学博士,研究方向为自然语言处理、深度学习及贝叶斯统计;曾就职于微软,从事自然语言处理和人工智能的开发工作。
-
潘翔,计算机应用博士,研究方向为卷积网络、大数据分析、大语言模型、多模态数据分析;主持了国家自然科学基金、浙江省科学技术厅等重点项目,在IEEE Journal of Biomedical and Health Informatics、《计算机学报》等期刊和国际会议上发表30多篇论文;目前就职于浙江工业大学计算机科学与技术学院。
-
戴弘毅,毕业于维克森林大学和波士顿大学,研究方向为自然语言处理、深度学习及金融市场分析。
-
-
直观感受:
-
这本书前半部分重点介绍了AI的基础知识,后半部着重描述RAG相关内容。此书非常适合对AI基本没啥了解的初学者入门RAG。
-
-
-
-
书名:《基于大模型的RAG应用开发与优化》
-
作者:严灿平
-
发布日期:2024-11-01
-
简介:本书是一本全面介绍基于大语言模型的RAG应用开发的专业图书。本书共分为3篇:预备篇、基础篇和高级篇。预备篇旨在帮助你建立起对大模型与RAG的基本认识,并引导你搭建起RAG应用开发的基础环境;基础篇聚焦于经典RAG应用开发的核心要素与阶段,介绍关键模块的开发过程,剖析相关的技术原理,为后面的深入学习打下坚实的基础;高级篇聚焦于RAG应用开发的高阶模块与技巧,特别是在企业级RAG应用开发中的优化策略与技术实现,并探索了一些新型的RAG工作流与范式,旨在帮助你了解新的RAG应用技术发展,掌握RAG应用的全方位开发能力。
-
受众群体:本书适合对大模型及RAG技术感兴趣的开发者、研究人员、产品经理及希望了解并掌握RAG应用开发能力的人阅读。
-
目录:
-
了解大模型与RAG
-
RAG应用开发环境搭建
-
初识RAG应用开发
-
模型与Prompt
-
数据加载与分割
-
数据嵌入与索引
-
检索、响应生成与RAG引擎
-
RAG引擎高级开发
-
开发Data Agent
-
评估RAG应用
-
企业级RAG应用的常见优化策略
-
构建端到端的企业级RAG应用
-
新型RAG范式原理与实现
-
-
个人分析
-
作家来历:毕业于南京理工大学计算机系,南京大学工商管理硕士。先后就职于联创(后与亚信科技合并)担任软件工程师与设计师,甲骨文中国(Oracle)担任中国区企业架构部首席架构师,上海慧问信息科技有限公司担任合伙人兼技术总监。现为独立IT咨询顾问,公众号“AI大模型应用实践”主理人。拥有超过20年的企业软件从业经验,专注于企业软件架构设计、互联网时代传统行业的IT转型、人工智能与大数据技术在企业应用的创新等。曾担任多项大型企业级软件系统核心架构师与咨询师,参与包括中国移动、中国电信等通信行业客户的核心业务运营支撑系统建设、智慧城市与政务行业互联网转型的IT咨询与规划。精通多种计算机软件开发技术与IT架构方法论,对移动互联网、大数据、人工智能在企业领域应用有深入的研究与实施经验。
-
直观感受:这本书的内容非常多,主要集中在RAG相关工具的介绍与使用,原理内容占比会偏少,适合实战RAG的开发者。
-
-
-
书名:《大模型RAG实战》
-
作者:汪鹏,谷清水,卞龙鹏
-
发布日期:2024-09-01
-
简介:这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。
-
受众群体:人工智能和大模型领域的技术工程师
-
目录:
-
RAG与大模型应用
-
语言模型基础
-
文本召回模型
-
RAG核心技术与优化方法
-
RAG范式演变
-
RAG系统训练
-
基于LangChain实现RAG应用
-
RAG系统构建与微调实战
-
-
个人分析
-
作家来历:
-
汪鹏:资深NLP技术专家和AI技术专家,拥有多年NLP落地经验。擅长结合用户场景,针对性地设计图谱、问答、检索、多模态、AIGC等相关的算法和落地方案。在Kaggle获得多枚奖牌,等级master。拥有公众号“NLP前沿”。
-
谷清水:毕业于清华大学,有国内多家大厂工作经历,7年深度学习项目开发经验。在KDD-CUP等机器学习竞赛中多次获奖,持有多项发明专利。知乎ID:“战士金”。
-
卞龙鹏:某上市公司资深AI算法工程师,多年互联网一线工作经验,10年机器学习与数据挖掘经验。持多项发明专利,发表多篇SCI文章,主攻机器视觉、模式识别、自然语言处理。
-
-
直观感受:这本书主要分基础、原理、实战三大部分,属于介绍RAG较为全面的书籍,指出了技术是什么?为什么?怎么做?技术原理较多。适合需要了解RAG本身技术原理和实战RAG的开发者。
-
-
国外
-
书名:《RAG-Driven Generative AI》(RAG 驱动的生成式AI)
-
作者:[法]丹尼斯·罗斯曼(Denis Rothman)
-
发布日期:2024-09-30
-
简介:RAG 驱动的生成式人工智能为构建有效的 LLM、计算机视觉和生成式人工智能系统提供了兼顾性能和成本的路线图。本书详细探讨了 RAG 以及如何设计、管理和控制多模态人工智能管道。通过将输出连接到可追溯的源文件,RAG 提高了输出的准确性和上下文相关性,为管理大量信息提供了一种动态方法。这本人工智能书籍向您展示了如何构建 RAG 框架,提供了关于向量存储、分块、索引和排序的实用知识。您将发现优化项目性能和更好地理解数据的技巧,包括使用自适应 RAG 和人工反馈来完善检索准确性、平衡 RAG 与微调、实施动态 RAG 以增强实时决策,以及使用知识图谱可视化复杂数据。您将亲身体验 LlamaIndex 和 Deep Lake 等框架、Pinecone 和 Chroma 等矢量数据库以及 Hugging Face 和 OpenAI 等模型。在本书结束时,您将掌握实施智能解决方案的技能,使您在从生产到客户服务的所有项目中保持竞争力。
-
受众群体:本书非常适合数据科学家、人工智能工程师、机器学习工程师和 MLOps 工程师阅读。如果您是解决方案架构师、软件开发人员、产品经理或项目经理,希望在构建 RAG 应用程序的过程中增强决策能力,那么您会发现本书非常有用。
-
目录:
-
为什么选择检索增强生成(RAG)
-
使用 Activeloop 和 OpenAI 的 RAG 嵌入向量存储
-
使用 LlamaIndex 和 Langchain 的基于索引的 RAG
-
利用 Pincecone 实现多模态模块化 RAG
-
利用专家人工反馈提升 RAG 性能
-
通过 Meta RAG 实现一体化
-
利用 Llamaindex 知识图谱组织 RAG
-
探索 RAG 的扩展极限
-
增强人工智能模型:微调 RAG 数据和人工反馈
-
构建从数据收集到生成人工智能的 RAG 管道
-
-
个人分析
-
作家来历:丹尼斯·罗斯曼Denis Rothman,毕业于索邦大学和巴黎一狄德罗大学,写过最早的word2vector embedding解决方案之一。他创作了第一批AI认知自然语言处理(NLP)聊天机器人之一,这个聊天机器人开启了他的职业生涯。它是一个语言教学应用程序,应用于Moet et Chandon和其他公司。他为IBM和服装生产商编写了一个AI资源优化器。然后,他还编写了一个在全球范围内使用的高级计划和排程(APS)解决方案。罗斯曼还是几本关于大语言模型(LLM)书籍的作者,包括《大模型应用解决方案》、《Python可解释AI(XAI)实战》等著作。
-
直观感受
-
从这本书的作者来看,简单看了下《大模型应用解决方案》的豆瓣评价(6.7分),褒贬不一,有人说这本书挺水的,有人说还可以。因此这本书的内容质量需要打个问号。
-
从这本书的目录来看,内容比较偏实战,理论部分占比很少。
-
-
-