快速生成嵌入：使用FastEmbed与LangChain

最新推荐文章于 2025-05-17 17:07:22 发布

dgay_hua

最新推荐文章于 2025-05-17 17:07:22 发布

阅读量371

点赞数 3

文章标签： langchain python

本文链接：https://blog.youkuaiyun.com/dgay_hua/article/details/146449954

版权

技术背景介绍

在自然语言处理（NLP）领域，生成高效的文档和查询嵌入是提高下游任务效果的关键一步。FastEmbed由Qdrant推出，是一个轻量级且快速的Python库，专为嵌入生成而设计。它通过量化的模型权重，以及使用ONNX Runtime使得在无PyTorch依赖的情况下也能运行，并且注重CPU优先的设计以支持大规模数据集的编解码。

核心原理解析

FastEmbed主要依赖ONNX Runtime进行计算，消除了对PyTorch的依赖。这意味着：

轻量高效：通过量化来减少模型大小，提高推理速度。
CPU优化：优先使用CPU，适合多样化的部署环境。
数据并行：支持对大型数据集的并行编码，提高处理速度。

代码实现演示(重点)

下面，我们将展示如何使用FastEmbed与LangChain库生成文档和查询嵌入。

环境配置

首先，确保安装了fastembed库：

%pip install --upgrade --quiet fastembed

嵌入生成示例

使用FastEmbed生成文档和查询嵌入：

from langchain_community.embeddings.fastembed import FastEmbedEmbeddings

# 初始化嵌入模型
embeddings = FastEmbedEmbeddings(
    model_name="BAAI/bge-small-en-v1.5",  # 使用预定义模型
    max_length=512,  # 最大token数量
    cache_dir='local_cache',  # 缓存目录
    threads=4,  # 使用的线程数量
    doc_embed_type="default",  # 文档嵌入类型
    batch_size=256,  # 批处理大小
    parallel=None  # 数据并行配置
)

# 生成文档嵌入
document_embeddings = embeddings.embed_documents(
    ["This is a document", "This is some other document"]
)
print("Document Embeddings:", document_embeddings)

# 生成查询嵌入
query_embeddings = embeddings.embed_query("This is a query")
print("Query Embeddings:", query_embeddings)