SemanticKernel/C#：检索增强生成(RAG)简易实践

最新推荐文章于 2025-06-26 19:00:55 发布

原创

最新推荐文章于 2025-06-26 19:00:55 发布 · 790 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#c#

检索增强生成(RAG)是什么？

RAG是“Reference-based Generative model with Attention”的缩写，也可以被称为“Retrieval-Augmented Generation”，是一种结合了检索技术和生成模型的方法，主要用于自然语言处理任务，如文本生成、对话系统、机器翻译等。RAG模型通过从外部知识库中检索相关信息，并将其与输入文本结合，以生成更准确、更丰富的输出。这种方法可以提高模型的准确性和可解释性，因为它可以明确地指出生成的文本与哪些外部知识相关。RAG模型在处理需要大量背景知识的任务时特别有用，如专业领域的问答系统或对话代理。

本示例实现的效果

在使用大语言模型的过程中，会发现大语言模型在通用知识上很强，但是如果你问的是跟私有数据有关的事情，它就不知道了。比如有一段私有文本数据如下所示：

小X于2000年创建了一家名为“小X的世界”的公司，公司总部在湖北武汉，员工有300人。小X最喜欢的编程语言是C#，小X最喜欢的书是《平凡的世界》。

这只是个简单的例子，所以文本先取的很短，实际上可以换成是你的一些私有文档，然后让大语言模型根据你的私有文档进行回答，现在你如果问大语言模型，“小X创建的公司叫什么？”、”小X最喜欢的编程语言是什么？“等等一些根据私有文档才能回答的问题，大语言模型是不知道的，但是通过RAG就可以让大语言模型回答诸如此类的需要根据私有文档才能回答的问题。

实现的思路是通过嵌入模型将文本转化为向量，将向量存入数据库，检索时基于输入查询的向量表示，从知识库中检索出最相关的文档或片段。将获取的相关片段，嵌入到Prompt中，让大语言模型根据获取到的片段进行回答。

开始实践

安装所需的nuget包：

首先先初始化一个Kernel，这里我使用的大语言模型是硅基流动平台提供的开源的Qwen/Qwen2-7B-Instruct。

 private readonly Kernel _kernel;
 public SemanticKernelService()
 {
   
   
     var handler = new OpenAIHttpClientHandler();
     var builder = Kernel.CreateBuilder()
     .AddOpenAIChatCompletion(
       modelId: "Qwen/Qwen2-7B-Instruct",
       apiKey: "api key",
       httpClient: new HttpClient(handler)

最低0.47元/天解锁文章