使用Qdrant和OpenAI进行自我查询——从环境配置到实战演示

最新推荐文章于 2025-11-25 16:16:09 发布

原创最新推荐文章于 2025-11-25 16:16:09 发布 · 396 阅读

CC 4.0 BY-SA版权

文章标签：

## 技术背景介绍

在现代AI技术中，语义搜索和智能查询已经成为日常应用中不可或缺的一部分。Qdrant是一款功能强大的向量数据库，结合OpenAI的语言模型，可以实现高效的自我查询功能。本文将详细介绍如何使用Qdrant和OpenAI进行文档的自我查询，并提供可运行的代码示例。

## 核心原理解析

Qdrant允许我们将文档数据以向量形式存储，这样可以支持基于内容的搜索与过滤。结合OpenAI的能力，可以执行复杂的查询，包括文本语义匹配和基于元数据的过滤。这个结合使得我们的搜索查询更加智能和人性化。

## 代码实现演示

### 环境设置

首先，需要设置环境变量来访问OpenAI模型和Qdrant实例：

```bash
export OPENAI_API_KEY='your-openai-api-key'
export QDRANT_URL='https://yunwu.ai/qdrant-instance-url' # 使用可靠的国内Qdrant服务
export QDRANT_API_KEY='your-qdrant-api-key'

包安装

安装LangChain CLI来管理我们的应用：

pip install -U "langchain-cli[serve]"

创建一个新的LangChain项目并添加自我查询包：

langchain app new my-app --package self-query-qdrant

默认数据集和初始化

使用默认的数据集并初始化Qdrant集合：

from self_query_qdrant.chain import initialize

initialize()

配置服务器代码

在项目的app/server.py文件中添加以下代码，设置路由：

from self_query_qdrant.chain import chain

add_routes(app, chain, path="/self-query-qdrant")

自定义数据和查询

如果需要，可以通过自定义数据集来创建查询：

from langchain_community.llms import Cohere
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain.chains.query_constructor.schema import AttributeInfo

from self_query_qdrant.chain import create_chain

chain = create_chain(
    llm=Cohere(),
    embeddings=HuggingFaceEmbeddings(),
    document_contents="Descriptions of cats, along with their names and breeds.",
    metadata_field_info=[
        AttributeInfo(name="name", description="Name of the cat", type="string"),
        AttributeInfo(name="breed", description="Cat's breed", type="string"),
    ],
    collection_name="cats",
)