解释用于 RAG 和摘要的 LLMs

原创于 2025-12-08 00:56:44 发布 · 558 阅读

29 ·

CC 4.0 BY-SA版权

License CC BY-NC-SA 4.0 / 自豪地采用谷歌翻译

文章标签：

#榛樿鍒嗙被

榛樿鍒嗙被专栏收录该内容

1011 篇文章

订阅专栏

原文：towardsdatascience.com/explaining-llms-for-rag-and-summarization-067e486020b4?source=collection_archive---------9-----------------------#2024-11-21

一种快速且低资源的基于相似度归因的方法

https://medium.com/@daniel-klitzke?source=post_page---byline--067e486020b4--------------------------------https://towardsdatascience.com/?source=post_page---byline--067e486020b4-------------------------------- Daniel Klitzke

·发表于Towards Data Science ·8 分钟阅读·2024 年 11 月 21 日

–

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/56119ebe547d500ce80bfe7a215b9ec8.png

输入文档与其摘要之间的信息流，计算方式由提出的可解释性方法得出。（图像由作者创建）

TL;DR

解释 LLMs 是非常缓慢且资源密集型的。
本文提出了一种任务特定的解释技术，即RAG 问答和摘要。
该方法是模型无关的，并且是基于相似度的。
该方法是低资源和低延迟的，因此几乎可以在任何地方运行。
我在Github上提供了代码，使用了Huggingface Transformers生态系统。

动机

有许多充分的理由需要为你的模型输出提供解释。例如，它们可以帮助你发现问题，或者它们可能仅仅是为用户提供更多透明度的一种方式，从而促进用户信任。这就是为什么对于像 XGBoost 这样的模型，我经常应用像SHAP这样的方法，以便更好地了解我的模型行为。

现在，随着我越来越多地处理基于 LLM 的机器学习系统，我想以与传统机器学习方法相同的方式探索解释 LLM 模型的方法。然而，我很快发现自己被卡住了，因为：

SHAP确实为基于文本的模型提供了示例，但对我来说，它们在新模型上失败了，因为 SHAP 不支持嵌入层。
Captum还提供了一个LLM 归因的教程；然而，所展示的两种方法也各自有非常具体的缺点。具体而言，基于扰动的方法速度太慢，而基于梯度的方法则导致我的 GPU 内存爆炸，最终失败。

在尝试了量化甚至启动 GPU 云实例并取得有限成功之后，我决定退后一步。

一种基于相似度的方法

为了理解这种方法，让我们首先简要定义我们想要达成的目标。具体而言，我们想要识别并突出显示输入文本中与模型输出高度相关的部分（例如，长文本文件或 RAG 上下文），这些输出可能是摘要或 RAG 回答。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/4a22728cf380398f046abd250ab10b39.png

我们的可解释性方法适用的典型任务流程。（图像由作者创建）

在摘要的情况下，我们的方法需要突出显示原始输入文本中在摘要中高度反映的部分。在RAG 系统的情况下，我们的方法需要突出显示 RAG 上下文中在答案中出现的文档块。

由于直接解释 LLM 本身对我来说已经证明是棘手的，因此我提议通过一个单独的文本相似度模型来建模模型输入与输出之间的关系。具体来说，我实现了以下简单但有效的方法：

我将模型输入和输出拆分成句子。
我计算了所有句子之间的成对相似度。
然后，我使用 Softmax归一化相似度得分。
之后，我将输入和输出句子之间的相似度可视化为一个漂亮的图表。

在代码中，这如下面所示。要运行代码，您需要Huggingface Transformers、Sentence Transformers和NLTK库。

请查看这个Github 仓库，获取与此博客文章相关的完整代码。

from sentence_transformers import SentenceTransformer
from nltk.tokenize import sent_tokenize
import numpy as np

# Original text truncated for brevity ...
text = """This section briefly summarizes the state of the art in the area of semantic segmentation and semantic instance segmentation. As the majority of state-of-the-art techniques in this area are deep learning approaches we will focus on this area. Early deep learning-based approaches that aim at assigning semantic classes to the pixels of an image are based on patch classification. Here the image is decomposed into superpixels in a preprocessing step e.g. by applying the SLIC algorithm [1].

Other approaches are based on so-called Fully Convolutional Neural Networks (FCNs). Here not an image patch but the whole image are taken as input and the output is a two-dimensional feature map that assigns class probabilities to each pixel. Conceptually FCNs are similar to CNNs used for classification but the fully connected layers are usually replaced by transposed convolutions which have learnable parameters and can learn to upsample the extracted features to the final pixel-wise classification result. ..."""

# Define a concise summary that captures the key points
summary = "Semantic segmentation has evolved from early patch-based classification approaches using superpixels to more advanced Fully Convolutional Networks (FCNs) that process entire images and output pixel-wise classifications."

# Load the embedding model
model = SentenceTransformer('BAAI/bge-small-en')

# Split texts into sentences
input_sentences = sent_tokenize(text)
summary_sentences = sent_tokenize(summary)

# Calculate embeddings for all sentences
input_embeddings = model.encode(input_sentences)
summary_embeddings = model.encode(summary_sentences)

# Calculate similarity matrix using cosine similarity
similarity_matrix = np.zeros((len(summary_sentences), len(input_sentences)))
for i, sum_emb in enumerate(summary_embeddings):
    for j, inp_emb in enumerate(input_embeddings):
        similarity = np.dot(sum_emb, inp_emb) / (np.linalg.norm(sum_emb) * np.linalg.norm(inp_emb))
        similarity_matrix[i, j] = similarity

# Calculate final attribution scores (mean aggregation)
final_scores = np.mean(similarity_matrix, axis=0)

# Create and print attribution dictionary
attributions = {
    sentence: float(score)
    for sentence, score in zip(input_sentences, final_scores)
}

print("\nInput sentences and their attribution scores:")
for sentence, score in attributions.items():
    print(f"\nScore {score:.3f}: {sentence}")

如您所见，到目前为止，这非常简单。显然，我们并没有解释模型本身。然而，我们或许可以对这种特定类型的任务（如摘要/ RAG 问答）输入与输出句子之间的关系有一个较好的理解。那么，这实际上如何表现，以及如何可视化归因结果以理解输出呢？

RAG 和摘要的评估

为了可视化这种方法的输出，我创建了两种可视化，分别适用于展示 LLM 输入与输出之间的特征归因或连接。

这些可视化是为 LLM 输入的摘要生成的，其内容如下：

本节讨论了语义分割和实例分割的最新技术进展，重点介绍了深度学习方法。早期的补丁分类方法使用超像素，而最近的全卷积网络（FCN）则为每个像素预测类别概率。FCN 类似于 CNN，但使用转置卷积进行上采样。标准架构包括 U-Net 和基于 VGG 的 FCN，它们针对计算效率和特征大小进行了优化。在实例分割方面，回顾了基于提议和实例嵌入的方法，包括使用提议进行实例分割和实例嵌入的概念。

特征归因的可视化

对于特征归因的可视化，我的选择是尽可能保持输入数据的原始表示。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1fcb363021a34a497d7e7c691eb1de3c.png

基于颜色映射的逐句特征归因分数的可视化。（图像由作者创建）

具体来说，我只是绘制了句子图，包括它们计算出的归因分数。因此，我将归因分数映射到相应句子的颜色。

在这种情况下，这向我们展示了一些总结和源句子中的主导模式，信息可能来自这些句子。具体来说，文中提到的FCN（全卷积网络）架构变种的主导性提及，以及基于提议和实例嵌入的实例分割方法的提及，都得到了清晰的突出显示。

一般来说，这种方法非常适合轻松捕捉总结任务输入中的归因，因为它非常接近原始表示，并且对数据的干扰非常小。我可以想象，也可以根据需要为 RAG 系统的用户提供这样的可视化。潜在地，输出还可以进一步处理，阈值化为某些特别相关的片段；然后，这也可以作为默认设置展示给用户，以突出相关的来源。

再次查看Github 仓库以获取可视化代码

信息流的可视化

另一种可视化技术侧重的不是特征归因，而主要是信息流动，即输入文本和摘要之间的信息流动。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/f032fd38c1af76db7f413c88f23bb556.png

输入文本和摘要中句子之间信息流的可视化，以 Sankey 图表示。（图像由作者创建）

具体来说，我在这里做的是首先根据归因分数确定输入句子和输出句子之间的主要连接。然后，我使用 Sankey 图可视化这些连接。这里，流动连接的宽度表示连接的强度，颜色则是基于摘要中的句子进行着色，以便更好的可追溯性。

在这里，可以看到摘要大部分遵循文本的顺序。然而，也有一些部分，LLM 可能结合了文本开头和结尾的信息，例如，摘要在第一句话中提到重点是深度学习方法。这是从输入文本的最后一句话提取的，并且在流程图中清楚地展示出来。

一般来说，我发现这种方法很有用，尤其是可以帮助我们了解 LLM 在多大程度上将信息从输入的不同部分进行聚合，而不仅仅是复制或改写某些部分。在我看来，这也有助于估算如果输出过度依赖 LLM 在不同信息片段之间建立联系时，可能存在的错误潜力。

可能的扩展与适配

在GitHub 上提供的代码中，我实现了前面章节中展示的基本方法的某些扩展。具体而言，我探索了以下内容：

使用不同的聚合方式，例如最大值，用于相似度评分。

这样做是有道理的，因为输出句子的平均相似度并不是最相关的。即使只有一个好的匹配，也可能对我们的解释很有帮助。
使用不同的窗口大小，例如，使用三句话的片段来计算相似度。

如果怀疑单一的句子不足以真正捕捉两个句子之间的相关性，进而创造更大的上下文，这也是有道理的。
使用基于交叉编码的模型，如重排序器。

这可能很有用，因为重排序器更明确地在一个模型中建模两个输入文档的相关性，对这两个文档中的细微语言更加敏感。也请参阅我在Towards Data Science上的最新文章。

如前所述，所有这些内容在提供的代码中都有演示，因此务必查看代码。

结论

一般来说，我发现很难找到能够真正展示 RAG 和总结中可解释性技术的教程，尤其是在“实时”场景中有用的技术，能够提供低延迟的技术似乎稀缺。然而，正如这篇文章所展示的，简单的解决方案已经能够在 RAG 用例中提供相当不错的结果，尤其是在展示文档与答案之间的关系时。我肯定会进一步探索这个问题，看看如何将其应用于 RAG 生产场景，因为提供可追溯的输出对我来说已经证明是极为宝贵的。如果你对这个话题感兴趣，并希望获得更多此类内容，请在Medium和LinkedIn上关注我。