LLM知识存储ChromaDB向量数据库应用

1、通过Docker快速部署ChromaDB

docker run -d --name chromadb-container -p 8000:8000 chromadb/chroma

2、打开ChromaDB提供的swagger地址 http://localhost:8000/docs

3、构建代码测试向量

以下代码做了基础测试,创建集合、文字转向量、插入集合、检索数据具体的可以查看Swagger文档提供了更多的操作,运行当前代码可以根据语意搜索到对应的内容,文字转向量需要部署应用Xinference

import requests
import hashlib


# 文字转向量
def embedding(data):
    url = "http://10.10.40.102:19997/v1/embeddings"
    headers = {
        "Content-Type": "application/json"
    }
    data = {
        "input": data,
        "model": "bge-large-zh-v1.5"
    }
    response = requests.post(url, headers=headers, json=data)

    vectorData = [item['embedding'] for item in response.json()['data']]
    return vectorData


# 创建集合
def create_collections(json):
    result = requests.post("http://localhost:8000/api/v1/collections?tenant=default_tenant&database=default_database",
                           json=json)
    return result


# 获取集合列表
def get_collections():
    result = requests.get("http://localhost:8000/api/v1/collections?tenant=default_tenant&database=default_database")
    return result


# 插入向量
def add_collections_vectory(collections_id, json):
    result = requests.post(f"http://localhost:8000/api/v1/collections/{collections_id}/add", json=json)
    print(result.json())


# 根据名称获取集合
def name_get_collections(collections_name):
    result = requests.get(
        f"http://localhost:8000/api/v1/collections/{collections_name}?tenant=default_tenant&database=default_database")
    return result


def delete_collections(collections_name):
    result = requests.delete(
        f"http://localhost:8000/api/v1/collections/{collections_name}?tenant=default_tenant&database=default_database")
    print(result.json())


# 数组转md5
def convert_to_md5(data):
    return [hashlib.md5(item.encode('utf-8')).hexdigest() for item in data]


# 添加向量数据
def conversion_data(raw_data):
    # 转唯一ID
    ids = convert_to_md5(raw_data)

    # 文字转向量
    embeddings = embedding(raw_data)

    # 转向量
    return {"embeddings": embeddings, "documents": raw_data, "ids": ids}


def retrieval(collections_name, name):
    collections_id = name_get_collections(collections_name).json().get("id")
    fruit = embedding(name)
    result = requests.post(f"http://localhost:8000/api/v1/collections/{collections_id}/query", json={
        "query_embeddings": fruit,
        "n_results": 5,  # 返回结果数量
        "include": [
            "metadatas",
            "distances",
            "documents"
        ]
    })
    print(result.json().get("distances"))
    print(result.json().get("documents"))


def generate(collections_name, raw_data):
    # 删除之前的集合
    delete_collections(collections_name)

    # 创建新集合
    create_collections({"name": collections_name})

    # 获取集合ID
    collections_id = name_get_collections(collections_name).json().get("id")

    # 把向量插入到chromadb
    add_collections_vectory(collections_id, conversion_data(raw_data))


# 生成数据插入到集合
generate("test", ["苹果", "香蕉", "汽车", "狗", "猫", "大象", "飞机", "坦克"])

# 检索数据
retrieval("test", "交通工具")

### 将OllamaEmbedding与ChromaDB集成的方法 为了实现OllamaEmbedding与ChromaDB的有效集成,需理解两者各自的功能以及它们如何协同工作来增强应用程序的数据处理能力。 #### 1. OllamaEmbedding简介 OllamaEmbedding是一种假设的技术名称,在此背景下可以认为是指一种用于生成向量表示(embeddings)的技术或库。这些嵌入通常是从文本或其他形式的数据中提取特征并将其转换成多维空间中的点,使得相似的内容在该空间里彼此靠近[^4]。 #### 2. ChromaDB概述 ChromaDB是一个专为高效存储和检索高维度数据设计的数据库系统。它特别适用于管理由机器学习模型产生的大量复杂结构化信息,比如图像、音频文件或者自然语言处理任务中的词向量等。通过索引机制优化查询性能,支持快速查找最接近给定输入项的结果集[^5]。 #### 3. 集成方案 要使这两种技术结合起来发挥作用: - **创建管道**:构建一条从原始数据到最终应用的工作流管线。这可能涉及预处理阶段,其中源材料被清理和标准化;接着利用OllamaEmbedding工具将经过准备后的资料转化为相应的向量表达。 - **存入ChromaDB**:一旦获得了合适的embedding输出,则可按照文档说明导入至ChromaDB实例之中保存起来以便后续访问。确保遵循官方指南完成安装配置过程,并适当调整参数以适应具体需求场景下的最佳实践建议[^6]。 - **执行搜索操作**:当需要基于某些条件筛选记录时,可以通过API接口提交请求给ChromaDB服务器端口,指定目标属性作为匹配依据之一。返回的对象列表即代表满足设定标准的最佳候选对象集合。 ```python import chromadb from ollama_embedding import get_embeddings # 假设这是获取embeddings的方式 # 初始化chromadb客户端连接 client = chromadb.Client() # 获取待插入的新条目embeddings new_item_vector = get_embeddings("example text") # 向chromadb添加新纪录 collection_name = 'my_collection' client.add(collection=collection_name, documents=[{"vector": new_item_vector}]) # 查询最近邻节点 query_result = client.query( collection=collection_name, q=[[0.1]*len(new_item_vector)], # 这里的q应该替换为你实际想要比较的目标向量 n_results=5 # 返回前五个最相近的结果 ) print(query_result) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值