1. 一段话总结
langchain_chroma.vectorstores.Chroma是LangChain与Chroma向量数据库的集成类,用于实现文档的向量存储与检索。使用前需安装chromadb和langchain-chroma依赖包,初始化时需配置核心参数(如collection_name默认值为langchain、必选的embedding_function嵌入函数,以及本地持久化persist_directory或远程/云端连接参数如host/port(默认8000)、chroma_cloud_api_key);支持添加/更新/删除文档(如add_documents/update_documents/delete)、多类型搜索检索(相似性搜索similarity_search、MMR搜索max_marginal_relevance_search、带过滤/得分的搜索),且提供完整的同步/异步方法(异步方法前缀为a,如aadd_documents/asimilarity_search),还可通过as_retriever方法转换为检索器,适配LangChain的检索增强流程。
2. 详细总结
1. 类定位与安装
- 定位:
langchain_chroma.vectorstores.Chroma是LangChain框架与Chroma向量数据库的集成类,用于实现文档的向量化存储、管理与相似性检索,支持本地、远程服务器及Chroma Cloud三种部署模式。 - 安装命令:需安装两个核心依赖包,命令如下:
pip install -qU chromadb langchain-chroma
2. 初始化参数(核心配置)
下表汇总初始化时的关键参数,按功能分类:
| 参数类别 | 参数名 | 类型 | 说明 | 默认值 |
|---|---|---|---|---|
| 索引参数 | collection_name | str | 向量集合的名称,用于区分不同数据集 | 'langchain' |
| embedding_function | Embeddings | None | 文档嵌入函数(如OpenAIEmbeddings),必选,用于将文本转为向量 | None(需手动指定) | |
| 客户端参数 | client | ClientAPI | None | 已初始化的Chroma客户端,可选(若不指定则自动创建) | None |
| client_settings | Settings | None | Chroma客户端配置(如超时、日志) | None | |
| persist_directory | str | None | 本地持久化目录,指定后向量数据会存储到该目录(避免内存丢失) | None(内存模式) | |
| host | str | None | 远程Chroma服务器地址(如部署在云服务器的Chroma服务) | None | |
| port | int | None | 远程Chroma服务器端口 | 8000 | |
| ssl | bool | 是否通过SSL加密连接远程服务器 | False | |
| headers | dict[str, str] | None | 发送给远程服务器的HTTP请求头(如认证信息) | None | |
| chroma_cloud_api_key | str | None | 连接Chroma Cloud的API密钥,云端连接必填 | None | |
| tenant | str | None | Chroma Cloud的租户ID,云端必填;本地默认租户 | 'default_tenant' |
|
| database | str | None | Chroma Cloud的数据库名,云端必填;本地默 |

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



