大模型RAG检索增强生成从入门到实战！

原创已于 2025-07-02 20:08:00 修改 · 867 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #大模型 #LLM #AI #RAG #检索增强生成

于 2025-07-02 20:07:06 首次发布

在这里插入图片描述

一、RAG的“尴尬”与“觉醒”

1.1 传统RAG的“直男式”检索

RAG系统的基本套路大家都懂：用户提问，系统先去知识库里“搜一搜”，然后把搜到的内容丢给大模型“写一写”，最后输出一段看似高大上的答案。

但问题来了：

用户问“XAI是什么？”——你给我一堆论文段落，啰嗦半天没说重点。
用户问“AI伦理怎么影响社会？”——你还是只会找最相似的几段，分析深度不够。
用户问“你觉得AI发展太快了吗？”——你一本正经地给我讲定义，完全没观点。
用户问“XAI在医疗怎么用？”——你只会泛泛而谈，没结合具体场景。

总结：传统RAG只会“机械检索”，不懂“见人说人话”。

1.2 自适应检索：让RAG“情商爆表”

想象一下，如果RAG能像老中医一样，望闻问切、对症下药——

问事实，精准检索、直击要害；
问分析，分解子问题、全方位覆盖；
问观点，搜集多元视角、百家争鸣；
问场景，结合用户上下文、量身定制。

这，就是自适应检索（Adaptive Retrieval） 的精髓！

二、RAG自适应检索的“武林秘籍”

2.1 四大门派：问题类型分类

首先，RAG要学会“看人下菜碟”——自动识别用户问题属于哪一类：

Factual（事实型）：要答案、要数据、要定义。
Analytical（分析型）：要原理、要因果、要全局视角。
Opinion（观点型）：要立场、要争鸣、要多元声音。
Contextual（情境型）：要结合用户背景、要定制化建议。

核心思路：用大模型（如Llama3）做问题分类，输出类别标签。

伪代码示意

def classify_query(query):
    # 用LLM判断问题类型，返回Factual/Analytical/Opinion/Contextual
    return LLM_classify(query)

2.2 四大绝学：检索策略随需应变

2.2.1 事实型：精准打击，直奔主题

策略：用LLM优化检索词，聚焦核心实体和关系，提升召回精度。
检索：向量相似度+LLM相关性打分，优中选优。

2.2.2 分析型：化整为零，面面俱到

策略：LLM自动拆解主问题为3个子问题，分别检索，保证覆盖广度。
检索：每个子问题检索2条，去重后合并，确保多角度。

2.2.3 观点型：百家争鸣，观点碰撞

策略：LLM生成3种不同观点/立场，分别检索相关内容。
检索：每个观点检索2条，优先保证多元性，再补充高相关内容。

2.2.4 情境型：上下文加持，量身定制

策略：LLM先推断用户隐含背景，再把背景和问题合并，生成定制检索词。
检索：检索后用LLM结合上下文打分，优先返回最贴合用户场景的内容。

伪代码示意

def adaptive_retrieval(query, vector_store, user_context=None):
    query_type = classify_query(query)
    if query_type == "Factual":
        return factual_strategy(query, vector_store)
    elif query_type == "Analytical":
        return analytical_strategy(query, vector_store)
    elif query_type == "Opinion":
        return opinion_strategy(query, vector_store)
    elif query_type == "Contextual":
        return contextual_strategy(query, vector_store, user_context)
    else:
        return factual_strategy(query, vector_store)

三、RAG自适应检索的“炼丹炉”全流程

3.1 数据准备：知识库炼成记

PDF文本抽取：用PyMuPDF等工具，把PDF里的内容全都扒出来。
文本切块：每1000字一块，重叠200字，保证检索粒度和上下文连贯。
向量化：用OpenAI/BAAI等embedding模型，把每块文本转成向量。
向量库：自建SimpleVectorStore，支持向量相似度检索。

伪代码示意

text = extract_text_from_pdf(pdf_path)
chunks = chunk_text(text, chunk_size=1000, overlap=200)
embeddings = create_embeddings(chunks)
vector_store = SimpleVectorStore()
for chunk, emb in zip(chunks, embeddings):
    vector_store.add_item(chunk, emb)

3.2 检索与生成：AI的“见招拆招”

3.2.1 检索环节

问题分类：LLM判断类型。
策略选择：按类型走不同检索分支。
多轮检索：有的类型（如分析/观点）要多次检索、合并去重。
相关性打分：LLM对检索结果再打分，优中选优。

3.2.2 生成环节

定制Prompt：根据问题类型，给LLM不同的系统提示词（如“请多角度分析”、“请结合上下文”）。
拼接上下文：把检索到的内容拼成大段context，丢给LLM。
生成答案：LLM输出最终答案。

伪代码示意

def generate_response(query, docs, query_type):
    context = "\n\n---\n\n".join([doc["text"] for doc in docs])
    system_prompt = get_prompt_by_type(query_type)
    return LLM_generate(system_prompt, context, query)

四、实战演练：自适应RAG VS 传统RAG，谁更强？

4.1 评测流程

准备知识库：比如一份AI相关的PDF。
设计多类型问题：事实、分析、观点、情境各来一发。
标准RAG：直接用向量相似度检索+LLM生成。
自适应RAG：用上面那套“见招拆招”流程。
人工参考答案：作为对比基准。
自动对比分析：LLM帮你点评两种方法的优劣。

伪代码示意

for query in test_queries:
    # 标准RAG
    docs_std = vector_store.similarity_search(create_embeddings(query))
    resp_std = generate_response(query, docs_std, "General")
    # 自适应RAG
    docs_adp = adaptive_retrieval(query, vector_store)
    resp_adp = generate_response(query, docs_adp, classify_query(query))
    # LLM自动对比
    compare(resp_std, resp_adp, reference_answer)