Day30上 - ChromaDB 向量数据库

向量数据库

  • vector storage engine
  • 存储向量
  • 关系型数据库:
    • table
      • id, name, age, school, address, ……
      • 增删改查:字符串本身的比较
  • 文档型数据库:
    • mongodb
      • collection:
        • document:
          • json
            • 每个json都是任意的结构
  • 键值对数据库:
    • redis:
      • 内存型,做缓存
      • key-value对
  • 存储向量
    • 虽然叫向量数据库,但是向量部分只是索引,数据本身还是重点
    • 数据查询时,使用向量进行语义化检索,而不是字符串匹配
    • 结构:
      • id, vector, text, metadata
      • id:唯一标识,数据管理时使用
      • vector:向量,用来做语义检索
      • text:文本,信息本身
      • metadata:元数据,用来做过滤
    • 兼容文档型和关系型数据库的特点
  • 常见的向量库:
    • FAISS
    • chromadb
    • pinecone
    • milvus
  • 语义检索:
    • 欧式距离(不开方)
    • 余弦相似度
    • 向量内积

ChromaDB

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值