使用Chroma和SelfQueryRetriever构建智能向量数据库应用

最新推荐文章于 2025-07-13 11:23:40 发布

原创

最新推荐文章于 2025-07-13 11:23:40 发布 · 511 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #python

技术背景介绍

在构建AI应用时，向量数据库（Vector Database）是一个相当关键的组件。它能够存储文本、图像等数据的向量表示，从而支持高效的相似度搜索。Chroma是一个用于构建AI应用的向量数据库，可以方便地存储和检索嵌入向量。

在本文中，我们将展示如何使用SelfQueryRetriever结合Chroma向量数据库，实现一个智能的文档检索系统。

核心原理解析

Chroma向量数据库

Chroma允许将文档以向量的形式存储，并基于向量的相似度进行高效检索。这对于需要快速查找相似内容的AI应用非常有用。

SelfQueryRetriever

SelfQueryRetriever是LangChain库中的一个可用对象，它能够基于预定义的文档元数据和内容描述进行智能查询，自动构建查询表达式并过滤检索结果。

代码实现演示

1. 安装必要依赖

%pip install --upgrade --quiet lark langchain-chroma

2. 获取OpenAI API Key

import getpass
import os

os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")

3. 创建Chroma向量存储

from langchain_chroma import Chroma
from langchain_core.documents import Document
from langchain_openai import OpenAIEmbeddings

# 初始化OpenAI嵌入
embeddings = OpenAIEmbeddings(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

eahba

关注关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

DB之VDB：向量数据库（Vector Database）的简介、常用库(Chroma/FAISS/Elasticsearch/Milvus/LanceDB/PGVector等)、使用方法之详细攻略

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

02-18

3113

DB之VDB：向量数据库（Vector Database）的简介、常用库(FAISS/Chroma等)、使用方法之详细攻略目录 向量数据库的简介 向量数据库的常用库 向量数据库的使用方法 向量数据库的简介 向量数据库是专门用来存储和查询向量的数据库，其存储的向量来自于对文本、语音、图像、视频等的向量化。与传统数据库相比，向量数据库可以处理更多非结构化数据（比如图像和音频）。在机器学习和深度学习中，数据通常以向量形式表示。向量

chromadb向量数据库搭建和使用

fudaihb的博客

02-13

3134

v ./chromadb:/chroma/chroma 将服务器存储路径./chromadb映射到容器路径/chroma/chroma。--env-file ./.chroma_env 容器服务chromadb运行时的相关配置。-p 8001:8000 将服务器8001端口映射到容器8000端口。需要安装依赖：pip install chromadb-client。

参与评论您还未登录，请先登录后发表或查看评论

【ubuntu】将Chroma配置为LINUX服务

applebomb的专栏

12-12

669

可惜官方没有去提供配置为服务的方法，而docker又不是特别感冒。所以自己研究了下chroma配置为服务的方式。我使用的是miniconda，直接默认安装在root用户目录下了。建立的执行环境为：llm。Chroma是一个轻量级向量数据库。既然是数据库，那么我希望它是能够长时间运行。环境：conda+python10。系统：ubuntu 22.04。

chroma本地化的向量数据库的技术调研

qq_44089890的博客

05-30

5291

安装你的本地电脑需要有完整的c++的环境不然在编译hnswlib库的时候会报错安装vs 勾选c++的桌面开发使用教程。

VDB之Chroma：Chroma/chromadb(一款优秀的向量数据库)的简介、安装、使用方法之详细攻略

热门推荐

07-13

1万+

VDB之Chroma：Chroma/chromadb(一款优秀的向量数据库)的简介、安装、使用方法之详细攻略目录相关文章 chroma的简介 chroma的安装 chroma的使用方法相关文章 DB之VDB：向量数据库（Vector Database）的简介、常用库、使用方法之详细攻略 https://yunyaniu.blog.youkuaiyun.com/article/details/129106195 chroma的简介 2023年4月，Chroma获得1800

探索Chroma向量数据库：使用SelfQueryRetriever构建智能AI应用

akhfuiigabv的博客

09-23

532

Chroma结合SelfQueryRetriever提供了一个强大且灵活的框架，适用于多个领域的AI应用。Langchain 官方文档Chroma GitHub 仓库。

打造智能AI应用：使用Chroma向量数据库和自查询检索器

adfyvatbia的博客

12-09

609

通过这篇文章，我们了解了如何使用Chroma向量数据库和自查询检索器来处理嵌入数据并进行高效的查询。- 官方文档- OpenAI API指南- Langchain库指南。

使用Chroma构建基于向量的AI应用

bBADAS的博客

02-26

362

在AI应用中，嵌入(embeddings)是将高维数据映射到低维空间的方式。向量存储(VectorStore)是一个存储向量数据的数据库，这在语义搜索和相似性比较中非常有用。Chroma是一个高度优化的向量数据库，它支持高效的向量存储、检索和管理。

使用Chroma和Langchain构建高效AI应用的指南

aehrutktrjk的博客

10-28

1196

本文介绍了如何用Chroma和Langchain快速实现AI应用的核心功能。Langchain 官方文档Chroma GitHub 仓库嵌入式网络讲座。

[打造智能AI应用：深入了解Chroma数据库及其用法]

tt_jishu的博客

09-18

495

Chroma数据库是构建智能AI应用的重要工具。通过本文的介绍，您应该掌握了基本的使用方法。为了进一步提升技能，建议阅读Chroma官方文档和相关的教程。

RAG进阶：开源的AI原生向量数据库Chroma

沐雪架构师

04-22

1097

Chroma 是一款开源的向量数据库，专为高效存储和检索高维向量数据设计。其核心能力在于语义相似性搜索，支持文本、图像等嵌入向量的快速匹配，广泛应用于大模型上下文增强（RAG）、推荐系统、多模态检索等场景。与传统数据库不同，Chroma 基于向量距离（如余弦相似度、欧氏距离）衡量数据关联性，而非关键词匹配。灵活集成：支持自定义嵌入模型（如 OpenAI、HuggingFace），兼容 LangChain 等框架。多模式存储：内存模式用于开发调试，持久化模式支持生产环境数据落地。1. 什么是 Chroma？

RAG实践（二）安装并使用向量数据库（chromadb）

ShuaiQIXiaoLuo的博客

01-14

7942

chromadb 是一个开源的向量数据库，专门用于存储和检索高维向量数据，轻量级，适合快速原型开发，适合新手练习。

向量数据库：Chroma

m0_37559973的博客

05-11

6864

Chroma是一个开源的嵌入式数据库。Chroma通过使知识(knowledge)、事实(facts)和技能(skills)可插拔，从而简化了大型语言模型（LLM）应用程序的构建。

LangChain教程 | Retrival之Retrievers详解 | 检索器教程

HRG520JN的博客

05-17

6284

检索器是给定非结构化查询返回文档的接口。它比矢量存储器更通用。检索者不需要能够存储文档，只需要能够返回（或检索）它们。向量存储可以用作检索器的主干，但也有其他类型的检索器。检索器接受字符串查询作为输入，并返回Documents 作为输出。

AI时代新宠，向量数据库

Tony.Dong的专栏

11-02

1334

向量数据库是一种专门用于存储和处理向量的数据库。

使用Chroma向量数据库和SelfQueryRetriever构建智能检索系统

qq_29929123的博客

09-08

992

Chroma是一个专为AI应用设计的向量数据库，它可以高效地存储和检索嵌入向量。在我们的示例中，我们将使用Chroma来存储电影信息及其向量表示。SelfQueryRetriever是LangChain库中的一个强大组件，它能够将自然语言查询转换为结构化的查询和过滤条件。这使得我们可以构建一个既能理解用户意图，又能精确检索的系统。本文介绍了如何使用Chroma向量数据库和SelfQueryRetriever构建智能检索系统。

Chroma向量检索实战：打造智能客服的“最强大脑”

南宫乘风-Linux运维-虚拟化容器-Python编程 ownit.top

04-28

1221

向量库（Vector Database）是一种专门设计用来存储和检索向量数据的数据库系统。在这个文件中使用的ChromaDB就是一种向量数据库。向量嵌入（Embeddings）：将文本、图像等非结构化数据转换为高维数字向量相似性搜索：基于向量间的距离（如余弦相似度）快速查找相似内容高效索引：使用特殊的索引结构（如HNSW）加速相似性搜索。

向量数据库 Chroma 和 Milvus的使用