LanceDB 开源项目教程

最新推荐文章于 2025-03-31 12:04:02 发布

陆滔柏Precious

最新推荐文章于 2025-03-31 12:04:02 发布

阅读量998

点赞数 20

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_01197/article/details/141046077

LanceDB 开源项目教程

lancedbDeveloper-friendly, serverless vector database for AI applications. Easily add long-term memory to your LLM apps!项目地址:https://gitcode.com/gh_mirrors/la/lancedb

项目介绍

LanceDB 是一个为向量搜索构建的开源数据库，具有持久存储功能，极大地简化了嵌入的检索、过滤和管理。LanceDB 的核心特性包括：

生产规模的向量搜索：无需管理服务器。
存储、查询和过滤向量、元数据和多模态数据：支持文本、图像、视频、点云等。
支持向量相似搜索、全文搜索和 SQL。
原生 Python 和 Javascript/Typescript 支持。
零拷贝自动版本管理：无需额外基础设施即可管理数据版本。
GPU 支持：在构建向量索引时。
生态系统集成：与 LangChain、LlamaIndex、Apache-Arrow、Pandas、Polars、DuckDB 等。

LanceDB 的核心是用 Rust 编写的，并基于 Lance，一个为高性能 ML 工作负载和快速随机访问设计的开源列式数据格式。

项目快速启动

安装 LanceDB

首先，确保你已经安装了 Python 环境，然后使用 pip 安装 LanceDB：

pip install lancedb

创建和查询表

以下是一个简单的示例，展示如何创建一个表并进行向量搜索：

import lancedb

# 连接到 LanceDB
db = lancedb.connect('data/sample_db')

# 创建一个表
data = [
    {"vector": [1.1, 2.3], "item": "foo", "price": 10},
    {"vector": [5.9, 2.6], "item": "bar", "price": 20}
]
table = db.create_table('my_table', data=data)

# 进行向量搜索
result = table.search([100, 100]).limit(2).to_pandas()
print(result)