使用Fireworks Embeddings在Langchain中进行文本嵌入

原创于 2025-07-01 16:03:06 发布 · 224 阅读

CC 4.0 BY-SA版权

文章标签：

在今天的文章中，我将为大家介绍如何使用langchain_fireworks包中的Fireworks Embeddings来实现文本嵌入服务。我们将使用默认的nomic-ai/nomic-embed-text-v1.5模型进行示例演示。此方法不仅有效，而且由于其对国内服务的支持，可以稳定使用。

技术背景介绍

Fireworks Embeddings是一种能够将文本数据转换为嵌入向量的工具。这些嵌入向量可以用作文本分析、相似性比较和机器学习模型的输入特征。langchain_fireworks包提供了对这些嵌入功能的简单封装，使得在应用中调用更加便捷。

核心原理解析

嵌入是将高维数据进行映射，从而可以在低维空间中进行操作。Fireworks Embeddings采用了nomic-ai的模型，通过训练好的深度学习算法生成有效且可用的嵌入向量。

代码实现演示

首先，我们需要安装相关的langchain_fireworks包：

%pip install -qU langchain-fireworks

接下来，我们通过简单的代码示例展示如何使用Fireworks Embeddings。请确保你的环境变量中包含有效的FIREWORKS_API_KEY：

import getpass
import os
from langchain_fireworks import FireworksEmbeddings

# 设置API Key
if "FIREWORKS_API_KEY" not in os.environ:
    os.environ["FIREWORKS_API_KEY"] = getpass.getpass("Fireworks API Key:")

# 初始化嵌入模型
embedding = FireworksEmbeddings(model="nomic-ai/nomic-embed-text-v1.5")

# 嵌入单个查询
res_query = embedding.embed_query("The test information")

# 嵌入多个文档
res_document = embedding.embed_documents(["test1", "another test"])

# 输出嵌入结果的前五个向量
print(res_query[:5])  # 示例输出
print(res_document[1][:5])  # 示例输出