langchain-chroma使用教程

1. 一段话总结

langchain_chroma.vectorstores.Chroma是LangChain与Chroma向量数据库的集成类,用于实现文档的向量存储与检索。使用前需安装chromadblangchain-chroma依赖包,初始化时需配置核心参数(如collection_name默认值为langchain、必选的embedding_function嵌入函数,以及本地持久化persist_directory或远程/云端连接参数如host/port(默认8000)、chroma_cloud_api_key);支持添加/更新/删除文档(如add_documents/update_documents/delete)、多类型搜索检索(相似性搜索similarity_search、MMR搜索max_marginal_relevance_search、带过滤/得分的搜索),且提供完整的同步/异步方法(异步方法前缀为a,如aadd_documents/asimilarity_search),还可通过as_retriever方法转换为检索器,适配LangChain的检索增强流程。

2. 详细总结

1. 类定位与安装
  • 定位langchain_chroma.vectorstores.Chroma是LangChain框架与Chroma向量数据库的集成类,用于实现文档的向量化存储、管理与相似性检索,支持本地、远程服务器及Chroma Cloud三种部署模式。
  • 安装命令:需安装两个核心依赖包,命令如下:
    pip install -qU chromadb langchain-chroma
    
2. 初始化参数(核心配置)

下表汇总初始化时的关键参数,按功能分类:

参数类别 参数名 类型 说明 默认值
索引参数 collection_name str 向量集合的名称,用于区分不同数据集 'langchain'
embedding_function Embeddings | None 文档嵌入函数(如OpenAIEmbeddings),必选,用于将文本转为向量 None(需手动指定)
客户端参数 client ClientAPI | None 已初始化的Chroma客户端,可选(若不指定则自动创建) None
client_settings Settings | None Chroma客户端配置(如超时、日志) None
persist_directory str | None 本地持久化目录,指定后向量数据会存储到该目录(避免内存丢失) None(内存模式)
host str | None 远程Chroma服务器地址(如部署在云服务器的Chroma服务) None
port int | None 远程Chroma服务器端口 8000
ssl bool 是否通过SSL加密连接远程服务器 False
headers dict[str, str] | None 发送给远程服务器的HTTP请求头(如认证信息) None
chroma_cloud_api_key str | None 连接Chroma Cloud的API密钥,云端连接必填 None
tenant str | None Chroma Cloud的租户ID,云端必填;本地默认租户 'default_tenant'
database str | None Chroma Cloud的数据库名,云端必填;本地默
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值