使用Gradient Embeddings与Langchain实现嵌入式查询

最新推荐文章于 2025-12-18 11:48:41 发布

原创最新推荐文章于 2025-12-18 11:48:41 发布 · 328 阅读

CC 4.0 BY-SA版权

文章标签：

在现代自然语言处理(NLP)任务中，嵌入技术尤为重要。Gradient提供了一个简单的Web API来创建嵌入，并可以细调和获取大语言模型(LLM)的完成度。本篇文章将介绍如何在Langchain中使用Gradient的Embedding功能。

技术背景介绍

Langchain是一个用于构建语言模型应用的工具库。Gradient提供了强大的嵌入功能，支持各种NLP任务如相似度计算、分类等。通过结合Gradient的Embedding功能，开发者可以轻松实现复杂的NLP任务。

核心原理解析

Gradient Embeddings通过将文本转换为向量空间，实现文本之间的相似度计算。通过这些嵌入，我们可以对输入文本进行比较和查询，找到最相关的结果。

代码实现演示

下面的代码演示了如何使用Gradient Embeddings与Langchain结合进行嵌入查询。

import os
from getpass import getpass
from langchain_community.embeddings import GradientEmbeddings
import numpy as np

# 设置环境变量以确保可以成功访问Gradient API
if not os.environ.get("GRADIENT_ACCESS_TOKEN", None):
    os.environ["GRADIENT_ACCESS_TOKEN"] = getpass("gradient.ai access token:")
if not os.environ.get("GRADIENT_WORKSPACE_ID", None):
    os.environ["GRADIENT_WORKSPACE_ID"] = getpass("gradient.ai workspace id:")

# 创建嵌入实例
documents = [
    "Pizza is a dish.",
    "Paris is the capital of France",
    "numpy is a lib for linear algebra",
]
query = "Where is Paris?"

# 实际可用的配置设置
embeddings = GradientEmbeddings(model="bge-large")

# 生成嵌入
documents_embedded = embeddings.embed_documents(documents)
query_result = embeddings.embed_query(query)

# 计算相似度
scores = np.array(documents_embedded) @ np.array(query_result).T
result = dict(zip(documents, scores))

print("查询结果相似度评分:", result)