BemiDB 使用教程

戚宾来

于 2025-03-31 11:44:41 发布

阅读量703

点赞数 25

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00699/article/details/146809904

BemiDB 使用教程

BemiDB Postgres read replica optimized for analytics 项目地址: https://gitcode.com/gh_mirrors/be/BemiDB

1. 项目介绍

BemiDB 是一个针对分析优化的 Postgres 读取副本。它包含一个单一的二进制文件，可以无缝连接到 Postgres 数据库，以压缩的列式格式复制数据，并允许使用其 Postgres 兼容的分析查询引擎运行复杂的查询。

BemiDB 的特点包括：

性能：运行分析查询比 Postgres 快 2000 倍。
单一二进制：由一个可以在任何机器上运行的单个二进制文件组成。
Postgres 复制：自动同步 Postgres 数据库的数据。
压缩数据：使用开放列式格式，表压缩比为 4x。
可扩展存储：存储与计算分离，支持本地磁盘或 S3。
查询引擎：针对分析工作负载优化的查询引擎。
Postgres 兼容：与 Postgres 生态系统的服务和工具集成。
开源：在 OSI 批准的许可下发布。

2. 项目快速启动

首先，安装 BemiDB：

curl -sSL https://raw.githubusercontent.com/BemiHQ/BemiDB/refs/heads/main/scripts/install.sh | bash

接着，从 Postgres 数据库同步数据：

./bemidb --pg-database-url postgres://postgres:postgres@localhost:5432/dbname sync

然后，启动 BemiDB 数据库：

./bemidb start

在 BemiDB 数据库上运行 Postgres 查询：

# 列出所有表
psql postgres://localhost:54321/bemidb -c "SELECT table_schema, table_name FROM information_schema.tables"

# 查询一个表
psql postgres://localhost:54321/bemidb -c "SELECT COUNT(*) FROM [table_name]"

3. 应用案例和最佳实践

运行复杂的分析查询：像使用 Postgres 数据库一样运行复杂的分析查询，而不必担心性能影响和索引。
简化数据堆栈：将数据堆栈简化为单个二进制文件，无需复杂设置、数据移动或奇怪的缩写，如 CDC、ETL、DW。
与 Postgres 兼容的工具和服务集成：使用 BI 工具、笔记本和 ORM 查询和可视化数据。
自动集中所有数据在数据湖仓：使用 Iceberg 表和对象存储上的 Parquet 数据文件。
持续归档数据：从 Postgres 数据库中归档数据，而不会影响主数据库。

4. 典型生态项目

BemiDB 可以与多种开源项目集成，例如：

Apache Iceberg：用于管理大型数据集的元数据。
Amazon S3：用于存储和管理数据。
Postgres：作为数据源。

以上是 BemiDB 的基本使用教程，希望能帮助您快速上手该项目。

BemiDB Postgres read replica optimized for analytics 项目地址: https://gitcode.com/gh_mirrors/be/BemiDB

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考