使用LangChain与Clarifai进行文本嵌入

原创于 2025-07-01 15:58:35 发布 · 286 阅读

CC 4.0 BY-SA版权

文章标签：

## 技术背景介绍

Clarifai是一家提供全方位AI生命周期服务的平台，涵盖数据探索、标注、模型训练、评估和推断。在这篇文章中，我们将展示如何使用LangChain与Clarifai的模型进行交互，特别是文本嵌入模型。

要使用Clarifai，您需要拥有一个账户并获取个人访问令牌(PAT)。您可以在[Clarifai账户设置](https://clarifai.com/settings/security)中找到或创建您的PAT。

## 核心原理解析

Clarifai提供了强大的嵌入模型，这些模型可以将文本或数据转换为向量表示，从而用于各种AI任务。LangChain是一个用于构建语言模型链的库，它可以轻松地集成Clarifai的嵌入服务。

## 代码实现演示

首先，我们需要安装Clarifai的Python客户端库。

```bash
# 安装所需的依赖库
%pip install --upgrade --quiet clarifai

接下来，导入必要的模块并设置个人访问令牌：

from getpass import getpass

# 请登录获取您的API密钥
CLARIFAI_PAT = getpass()

from langchain.chains import LLMChain
from langchain_community.embeddings import ClarifaiEmbeddings
from langchain_core.prompts import PromptTemplate

创建一个提示模板供LLM链使用：

template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate.from_template(template)

设置用户ID和应用ID以指定模型所在的应用。您可以通过Clarifai的模型探索页面查看已发布的模型列表。初始化嵌入模型：

USER_ID = "clarifai"
APP_ID = "main"
MODEL_ID = "BAAI-bge-base-en-v15"
MODEL_URL = "https://clarifai.com/clarifai/main/models/BAAI-bge-base-en-v15"

# 初始化嵌入模型
embeddings = ClarifaiEmbeddings(user_id=USER_ID, app_id=APP_ID, model_id=MODEL_ID)

# 使用模型URL初始化嵌入模型
embeddings = ClarifaiEmbeddings(model_url=MODEL_URL)

然后，我们可以将文本嵌入为向量：

text = "roses are red violets are blue."
text2 = "Make hay while the sun shines."

# 嵌入单行文本
query_result = embeddings.embed_query(text)

# 嵌入文本列表
doc_result = embeddings.embed_documents([text, text2])