RAG 检索增强生成 | 领域书籍分析

分析一波有关RAG相关的国内外书籍。欢迎大家发表关于这些书籍的想法。

国内

  • 书名:《大模型应用开发:RAG入门与实战》

    图片

    • 作者:陈明明、潘翔、戴弘毅

    • 发布日期:2024-10-01

    • 简介:本书详细解析了RAG(Retrieval-Augmented Generation,检索增强生成)技术及其应用,从文档的分块与向量化,到利用深度学习模型进行向量检索,再到结合Prompt技术以实现精准响应,每个知识点都有清晰的逻辑阐述与实践案例;同时,介绍了PyTorch编程基础与深度学习概念。此外,本书还涵盖了一系列实用技术,如Web可视化工具Streamlit与Gradio的使用,以及如何利用这些工具快速构建交互式界面,直观展示RAG技术的效果。最后,通过动手实现PDF阅读器的实例,读者能亲自体验从理论到实践的过程,加深对RAG技术的理解与掌握。

    • 受众群体:适合对文档搜索和RAG应用感兴趣的读者阅读,也可以作为从事大语言模型相关工作的人员的参考书。

    • 目录:

      • RAG概述

      • Pytorch编程基础

      • 深度学习基础

      • 自然语言处理基础

      • Web可视化

      • RAG文档分块和向量化

      • RAG向量检索技术

      • RAG中的Prompt技术

      • 动手实现PDF阅读器

    • 个人分析

      • 作家来历:

        • 陈明明,数据科学博士,研究方向为自然语言处理、深度学习及贝叶斯统计;曾就职于微软,从事自然语言处理和人工智能的开发工作。

        • 潘翔,计算机应用博士,研究方向为卷积网络、大数据分析、大语言模型、多模态数据分析;主持了国家自然科学基金、浙江省科学技术厅等重点项目,在IEEE Journal of Biomedical and Health Informatics、《计算机学报》等期刊和国际会议上发表30多篇论文;目前就职于浙江工业大学计算机科学与技术学院。

        • 戴弘毅,毕业于维克森林大学和波士顿大学,研究方向为自然语言处理、深度学习及金融市场分析

      • 直观感受:

        • 这本书前半部分重点介绍了AI的基础知识,后半部着重描述RAG相关内容。此书非常适合对AI基本没啥了解的初学者入门RAG。

  • 书名:《基于大模型的RAG应用开发与优化》

    图片

    • 作者:严灿平

    • 发布日期:2024-11-01

    • 简介:本书是一本全面介绍基于大语言模型的RAG应用开发的专业图书。本书共分为3篇:预备篇、基础篇和高级篇。预备篇旨在帮助你建立起对大模型与RAG的基本认识,并引导你搭建起RAG应用开发的基础环境;基础篇聚焦于经典RAG应用开发的核心要素与阶段,介绍关键模块的开发过程,剖析相关的技术原理,为后面的深入学习打下坚实的基础;高级篇聚焦于RAG应用开发的高阶模块与技巧,特别是在企业级RAG应用开发中的优化策略与技术实现,并探索了一些新型的RAG工作流与范式,旨在帮助你了解新的RAG应用技术发展,掌握RAG应用的全方位开发能力。

    • 受众群体:本书适合对大模型及RAG技术感兴趣的开发者、研究人员、产品经理及希望了解并掌握RAG应用开发能力的人阅读。

    • 目录:

      • 了解大模型与RAG

      • RAG应用开发环境搭建

      • 初识RAG应用开发

      • 模型与Prompt

      • 数据加载与分割

      • 数据嵌入与索引

      • 检索、响应生成与RAG引擎

      • RAG引擎高级开发

      • 开发Data Agent

      • 评估RAG应用

      • 企业级RAG应用的常见优化策略

      • 构建端到端的企业级RAG应用

      • 新型RAG范式原理与实现

    • 个人分析

      • 作家来历:毕业于南京理工大学计算机系,南京大学工商管理硕士。先后就职于联创(后与亚信科技合并)担任软件工程师与设计师,甲骨文中国(Oracle)担任中国区企业架构部首席架构师,上海慧问信息科技有限公司担任合伙人兼技术总监。现为独立IT咨询顾问,公众号“AI大模型应用实践”主理人。拥有超过20年的企业软件从业经验,专注于企业软件架构设计、互联网时代传统行业的IT转型、人工智能与大数据技术在企业应用的创新等。曾担任多项大型企业级软件系统核心架构师与咨询师,参与包括中国移动、中国电信等通信行业客户的核心业务运营支撑系统建设、智慧城市与政务行业互联网转型的IT咨询与规划。精通多种计算机软件开发技术与IT架构方法论,对移动互联网、大数据、人工智能在企业领域应用有深入的研究与实施经验。

      • 直观感受:这本书的内容非常多,主要集中在RAG相关工具的介绍与使用,原理内容占比会偏少,适合实战RAG的开发者。

  • 书名:《大模型RAG实战》

    图片

    • 作者:汪鹏,谷清水,卞龙鹏

    • 发布日期:2024-09-01

    • 简介:这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。

    • 受众群体:人工智能和大模型领域的技术工程师

    • 目录:

      • RAG与大模型应用

      • 语言模型基础

      • 文本召回模型

      • RAG核心技术与优化方法

      • RAG范式演变

      • RAG系统训练

      • 基于LangChain实现RAG应用

      • RAG系统构建与微调实战

    • 个人分析

      • 作家来历:

        • 汪鹏:资深NLP技术专家和AI技术专家,拥有多年NLP落地经验。擅长结合用户场景,针对性地设计图谱、问答、检索、多模态、AIGC等相关的算法和落地方案。在Kaggle获得多枚奖牌,等级master。拥有公众号“NLP前沿”。

        • 谷清水:毕业于清华大学,有国内多家大厂工作经历,7年深度学习项目开发经验。在KDD-CUP等机器学习竞赛中多次获奖,持有多项发明专利。知乎ID:“战士金”。

        • 卞龙鹏:某上市公司资深AI算法工程师,多年互联网一线工作经验,10年机器学习与数据挖掘经验。持多项发明专利,发表多篇SCI文章,主攻机器视觉、模式识别、自然语言处理。

      • 直观感受:这本书主要分基础、原理、实战三大部分,属于介绍RAG较为全面的书籍,指出了技术是什么?为什么?怎么做?技术原理较多。适合需要了解RAG本身技术原理和实战RAG的开发者。

国外

  • 书名:《RAG-Driven Generative AI》(RAG 驱动的生成式AI)

    图片

    • 作者:[法]丹尼斯·罗斯曼(Denis Rothman)

    • 发布日期:2024-09-30

    • 简介RAG 驱动的生成式人工智能为构建有效的 LLM、计算机视觉和生成式人工智能系统提供了兼顾性能和成本的路线图。本书详细探讨了 RAG 以及如何设计、管理和控制多模态人工智能管道。通过将输出连接到可追溯的源文件,RAG 提高了输出的准确性和上下文相关性,为管理大量信息提供了一种动态方法。这本人工智能书籍向您展示了如何构建 RAG 框架,提供了关于向量存储、分块、索引和排序的实用知识。您将发现优化项目性能和更好地理解数据的技巧,包括使用自适应 RAG 和人工反馈来完善检索准确性、平衡 RAG 与微调、实施动态 RAG 以增强实时决策,以及使用知识图谱可视化复杂数据。您将亲身体验 LlamaIndex 和 Deep Lake 等框架、Pinecone 和 Chroma 等矢量数据库以及 Hugging Face 和 OpenAI 等模型。在本书结束时,您将掌握实施智能解决方案的技能,使您在从生产到客户服务的所有项目中保持竞争力。

    • 受众群体:本书非常适合数据科学家、人工智能工程师、机器学习工程师和 MLOps 工程师阅读。如果您是解决方案架构师、软件开发人员、产品经理或项目经理,希望在构建 RAG 应用程序的过程中增强决策能力,那么您会发现本书非常有用。

    • 目录

      • 为什么选择检索增强生成(RAG)

      • 使用 Activeloop 和 OpenAI 的 RAG 嵌入向量存储

      • 使用 LlamaIndex 和 Langchain 的基于索引的 RAG

      • 利用 Pincecone 实现多模态模块化 RAG

      • 利用专家人工反馈提升 RAG 性能

      • 通过 Meta RAG 实现一体化

      • 利用 Llamaindex 知识图谱组织 RAG

      • 探索 RAG 的扩展极限

      • 增强人工智能模型:微调 RAG 数据和人工反馈

      • 构建从数据收集到生成人工智能的 RAG 管道

    • 个人分析

      • 作家来历:丹尼斯·罗斯曼Denis Rothman,毕业于索邦大学和巴黎一狄德罗大学,写过最早的word2vector embedding解决方案之一。他创作了第一批AI认知自然语言处理(NLP)聊天机器人之一,这个聊天机器人开启了他的职业生涯。它是一个语言教学应用程序,应用于Moet et Chandon和其他公司。他为IBM和服装生产商编写了一个AI资源优化器。然后,他还编写了一个在全球范围内使用的高级计划和排程(APS)解决方案。罗斯曼还是几本关于大语言模型(LLM)书籍的作者,包括《大模型应用解决方案》、《Python可解释AI(XAI)实战》等著作。

      • 直观感受

        • 从这本书的作者来看,简单看了下《大模型应用解决方案》的豆瓣评价(6.7分),褒贬不一,有人说这本书挺水的,有人说还可以。因此这本书的内容质量需要打个问号。

        • 从这本书的目录来看,内容比较偏实战,理论部分占比很少。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值