检索增强生成(RAG)实战1-基于LlamaIndex构建第一个RAG应用

最新推荐文章于 2025-09-11 02:32:06 发布

原创最新推荐文章于 2025-09-11 02:32:06 发布 · 2.1k 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #langchain #AI产品经理 #大模型 #产品经理 #AI #ai大模型

本文将介绍如何使用LlamaIndex构建一个非常简单的RAG应用。通过该案例，可以初步了解LlamaIndex构建RAG应用的大体流程。

环境准备

安装LlamaIndex

安装LlamaIndex相关包：

bash

pip install llama-index
pip install llama-index-embeddings-huggingface
pip install llama-index-llms-huggingface

llama-index是核心包；llama-index-embeddings-huggingface允许我们使用本地的embedding模型去完成文档的切分和编码等操作；llama-index-llms-huggingface允许我们使用本地的大模型去开发RAG应用。

安装完成后，检查服务器cuda版本是否与当前安装的pytorch对应，如果不对应，需要将pytorch版本降低到≤服务器cuda版本（详细见搭建一个大模型API服务）：

bash

pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2

下载embedding模型权重

使用BAAI开源的中文bge模型作为embedding模型，使用以下命令将模型权重下载到服务器：

bash

git clone https://huggingface.co/BAAI/bge-base-zh-v1.5

下载大模型权重

使用阿里开源的通义千问大模型，使用以下命令将模型权重下载到服务器：

bash

git clone https://www.modelscope.cn/qwen/Qwen1.5-14B-Chat.git

构建第一个RAG应用-中医临床诊疗术语证候问答

文档准备

本应用使用的文档是由国家卫生健康委员和会国家中医药管理局发布的中医临床诊疗术语第2部分：证候。其部分内容展示如下：

3.5.5.5
    湿浊蒙窍证  syndrome/pattern of dampness-turbidity clouding orifices
    因湿浊壅盛，上蒙清窍所致。临床以头重闷胀，眩晕欲仆，恶心，呕吐唾沫，胸闷，舌苔白厚或垢腻，脉濡缓或滑，可伴见脑鸣、耳胀，听音不真，或眼球震颤，视物模糊，眼前有灰黄色暗影遮挡，或鼻塞、涕浊，不闻香臭等为特征的证候。

3.5.5.6
    湿浊上泛证  syndrome/pattern of dampness-turbidity flooding in the upper
    湿浊蒙上，泌别失职证
    湿浊蒙上证
    因湿浊内蕴，邪犯清空，泌别失职所致。临床以头晕作胀，神志昏蒙、恍惚，恶心、呕吐，面色晦滞，少尿或无尿，舌质淡，舌苔厚浊，脉沉缓，可伴见脘腹闷胀，不思饮食，皮肤干燥、瘙痒等为特征的证候。

3.5.5.7
    湿浊冲心证  syndrome/pattern of dampness-turbidity attacking heart
    因湿浊内蕴，壅阻心脉，上攻冲心，壅闭心神所致。临床以胸膺憋闷，心悸、怔忡，或神志恍惚，甚则昏昧，言语时或错乱，舌苔厚腻，脉弦或缓，可伴见心胸痹痛，面色晦滞，呕吐、不食等为特征的证候。

将中医临床诊疗术语证候.txt放入项目根目录下的document文件夹中。

导入所需的包

python

import logging
import sys
import torch
from llama_index.core import PromptTemplate, Settings, SimpleDirectoryReader, VectorStoreIndex, load_index_from_storage, \
    StorageContext, QueryBundle
from llama_index.core.schema import MetadataMode
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.huggingface import HuggingFaceLLM
from llama_index.core.node_parser import SentenceSplitter

定义日志配置

python

logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

如果想看到更多的日志输出，将level的级别改为logging.DEBUG。

定义System Prompt

python

SYSTEM_PROMPT = """You are a helpful AI assistant."""
query_wrapper_prompt = PromptTemplate(
    "[INST]<<SYS>>\n" + SYSTEM_PROMPT + "<</SYS>>\n\n{query_str}[/INST] "
)

使用llama-index-llms-huggingface构建本地大模型

python

llm = HuggingFaceLLM(
    context_window=4096,
    max_new_tokens=2048,
    generate_kwargs={"temperature": 0.0, "do_sample": False},
    query_wrapper_prompt=query_wrapper_prompt,
    tokenizer_name='/yldm0226/models/Qwen1.5-14B-Chat',
    model_name='/yldm0226/models/Qwen1.5-14B-Chat',
    device_map="auto",
    model_kwargs={"torch_dtype": torch.float16},
)
Settings.llm = llm

tokenizer_name和model_name后面的路径为前面下载的大模型权重的存储路径。

使用llama-index-embeddings-huggingface构建本地embedding模型

python

Settings.embed_model = HuggingFaceEmbedding(
    model_name="/yldm0226/RAG/BAAI/bge-base-zh-v1.5"
)

model_name是前面下载的embedding模型权重的存储路径。

读取文档

python

documents = SimpleDirectoryReader("document").load_data()

对文档进行切分，将切分后的片段转化为embedding向量，构建向量索引

python

index = VectorStoreIndex.from_documents(documents, transformations=[SentenceSplitter(chunk_size=256)])

chunk_size可以控制切分片段的大小。

构建查询引擎

python

query_engine = index.as_query_engine(similarity_top_k=5)

similarity_top_k决定了我们将检索出多少个片段用于RAG。

获得答案

python

response = query_engine.query("不耐疲劳，口燥、咽干可能是哪些证候？")

稍作等待后，得到以下输出：

从中医的角度来看，口燥、咽干且不耐疲劳可能与以下几个证候相关：

津液不足证 或 津亏证：由于津液生成不足或者体内燥热导致津液耗损，表现为口眼喉鼻干燥，大便干结，小便少，舌质红干，脉细数。
津亏热结证：津液亏乏加上热邪内结，也可见口燥咽干，可能伴有便秘。
津液亏耗证 或 液干热结证：津液亏损可能导致口干、口渴，皮肤干燥，甚至影响消化功能（如大便干结）。
津液亏涸证：严重的津液亏损会出现口唇干燥、鼻燥、皮肤干瘪等症状。
燥干清窍证：长期气候干燥或环境因素导致的津液耗损，表现为口鼻咽喉干燥，眼睛干涩。
津伤化燥证 或 津伤燥热证：体内燥热伤津，也会有口干、舌燥、食多善饥、皮肤干燥等表现。

综合以上，这些证候都有可能涉及到口燥咽干和不耐疲劳的症状，但具体需要结合病史和全身症状来确诊。建议就诊中医师进行辨证论治。

如何系统的去学习AI大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

👉优快云大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍