Pycharm上如何查看Chroma向量数据库

文章目录


在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
:向量数据库Chroma的底层数据存储使用的SQLite数据库。
在这里插入图片描述

下列代码会报这个错误,分析原因:进程已结束,退出代码为 -1073741819 (0xC0000005) import torch import chromadb from transformers import AutoTokenizer, AutoModel Embedding_model_path = r'D:/My_project/LLM_Demo/models/Embedding/Qwen3-Embedding-0.6B' #Embedding模型的存储路径 embedding_tokenizer = AutoTokenizer.from_pretrained( Embedding_model_path, trust_remote_code=True, local_files_only=True ) embedding_models = AutoModel.from_pretrained( Embedding_model_path, trust_remote_code=True, local_files_only=True, ) chroma_path = r'D:/My_project/LLM_Demo/Chroma_datasets' #向量数据库本地文件夹 chroma_client = chromadb.PersistentClient(chroma_path) #向量数据库本地持久化存储 collection = chroma_client.get_or_create_collection(name='test1') #获取/创建向量集合 #文本块 document = [ "北京是中国的首都", "生病了应该喝感冒药", "纽约是美国的一座城市", "新加坡是一个美丽的城市" ] #文本块的ids my_ids = [] for i in range(1,len(document)+1): id = 'ids' + str(i) my_ids.append(id) my_embedding = [] for doc in document: # 编码文本 inputs = embedding_tokenizer(doc, padding=True, truncation=True, return_tensors="pt") # 推理 with torch.no_grad(): outputs = embedding_models(**inputs) # 获取嵌入向量 result = outputs.last_hidden_state.mean(dim=1) embedding = result[0].numpy().tolist() my_embedding.append(embedding) #将处理好的数据存入向量数据库中,向量数据库包含了(文本块| 向量数据| 编号) collection.add( documents=document, embeddings=my_embedding, ids=my_ids ) results = collection.query( query_texts="中国首都", n_results=1 )
07-29
PyCharm 中配置和使用向量数据库,主要是通过 Python 脚本与向量数据库库(如 FAISS、Milvus、Weaviate 等)进行交互。PyCharm 作为一款功能强大的 Python IDE,提供了代码编写、调试、运行以及依赖管理的完整开发环境。 ### 安装必要的库 首先需要安装用于操作向量数据库的相关 Python 库。例如,若选择使用 FAISS 作为向量数据库,则可以通过以下命令安装: ```bash pip install faiss-cpu numpy ``` 也可以直接在 PyCharm 的终端中执行上述命令来安装所需依赖包[^3]。 ### 创建项目并配置解释器 1. 打开 PyCharm 并创建一个新项目。 2. 在“Settings”或“Preferences”中设置项目的 Python 解释器,确保所选解释器已安装所需的向量数据库相关库。 3. 若某些依赖未被安装,可以在 PyCharm 的 Package Installer 页面搜索并安装相应的库。 ### 编写向量数据库交互脚本 以下是一个简单的示例,展示如何在 PyCharm 中使用 FAISS 构建向量索引,并进行相似性搜索: ```python import numpy as np import faiss # 设置维度 dimension = 64 # 随机生成一些向量数据 np.random.seed(1) num_vectors = 1000 vectors = np.random.random((num_vectors, dimension)).astype('float32') # 创建FAISS索引 index = faiss.IndexFlatL2(dimension) # 使用 L2 距离作为相似度度量 index.add(vectors) # 将向量添加到索引中 # 查询向量 query_vector = vectors[np.random.randint(num_vectors)].reshape(1, -1) k = 5 # 查找最接近的5个向量 distances, indices = index.search(query_vector, k) print("最近邻索引:", indices) print("对应距离:", distances) ``` 此脚本演示了向量数据的索引构建和查询过程,适用于本地向量检索场景[^1]。 ### 连接远程向量数据库 如果计划连接更复杂的向量数据库系统,例如 Weaviate 或 Milvus,还需引入对应的客户端库并进行网络配置: - 对于 **Weaviate**: ```bash pip install weaviate-client ``` 示例代码: ```python import weaviate client = weaviate.Client("http://localhost:8080") # 替换为实际地址 if client.is_ready(): print("成功连接至 Weaviate 向量数据库") else: print("无法连接,请检查服务状态") ``` - 对于 **Milvus**: ```bash pip install pymilvus ``` 示例代码: ```python from pymilvus import connections connections.connect(host='localhost', port='19530') # 替换为实际主机和端口 print("当前连接状态:", connections.get_server_version()) ``` 以上步骤展示了如何在 PyCharm 中配置和使用向量数据库的基本流程[^2]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值