Pycharm上如何查看Chroma向量数据库

文章目录


在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
:向量数据库Chroma的底层数据存储使用的SQLite数据库。
在这里插入图片描述

下列代码会报这个错误,分析原因:进程已结束,退出代码为 -1073741819 (0xC0000005) import torch import chromadb from transformers import AutoTokenizer, AutoModel Embedding_model_path = r'D:/My_project/LLM_Demo/models/Embedding/Qwen3-Embedding-0.6B' #Embedding模型的存储路径 embedding_tokenizer = AutoTokenizer.from_pretrained( Embedding_model_path, trust_remote_code=True, local_files_only=True ) embedding_models = AutoModel.from_pretrained( Embedding_model_path, trust_remote_code=True, local_files_only=True, ) chroma_path = r'D:/My_project/LLM_Demo/Chroma_datasets' #向量数据库本地文件夹 chroma_client = chromadb.PersistentClient(chroma_path) #向量数据库本地持久化存储 collection = chroma_client.get_or_create_collection(name='test1') #获取/创建向量集合 #文本块 document = [ "北京是中国的首都", "生病了应该喝感冒药", "纽约是美国的一座城市", "新加坡是一个美丽的城市" ] #文本块的ids my_ids = [] for i in range(1,len(document)+1): id = 'ids' + str(i) my_ids.append(id) my_embedding = [] for doc in document: # 编码文本 inputs = embedding_tokenizer(doc, padding=True, truncation=True, return_tensors="pt") # 推理 with torch.no_grad(): outputs = embedding_models(**inputs) # 获取嵌入向量 result = outputs.last_hidden_state.mean(dim=1) embedding = result[0].numpy().tolist() my_embedding.append(embedding) #将处理好的数据存入向量数据库中,向量数据库包含了(文本块| 向量数据| 编号) collection.add( documents=document, embeddings=my_embedding, ids=my_ids ) results = collection.query( query_texts="中国首都", n_results=1 )
07-29
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值