引言
在现代自然语言处理(NLP)任务中,嵌入(Embeddings)技术的应用越来越广泛。Infinity是一个MIT许可的嵌入服务器项目,允许用户通过Langchain库轻松创建嵌入。本文旨在介绍如何使用Infinity Embeddings和Langchain结合进行嵌入创建,并提供实际的代码示例。
主要内容
Infinity项目提供两种主要的嵌入使用方法:直接从Python调用和通过API连接到运行的服务器实例。我们将逐一探讨这两种方法。
1. 直接从Python调用Infinity
通过直接调用Python库进行嵌入创建,可以快速地在本地环境中实现。以下是实现步骤:
安装Infinity库
确保安装了必要的依赖:
pip install infinity_emb[torch,optimum]
嵌入创建
使用示例文档和查询创建嵌入:
from langchain_community.embeddings import InfinityEmbeddingsLocal
import numpy as np
documents = [
"Baguette is a dish.",
"Paris is the capital of France.",
"numpy is a lib for linear algebra",
"You escaped what I've escaped - You'd be in Paris getting fucked up too",
]
query = "Where is Paris?"
embeddings = InfinityEmbeddingsLocal