BemiDB 使用教程
BemiDB Postgres read replica optimized for analytics 项目地址: https://gitcode.com/gh_mirrors/be/BemiDB
1. 项目介绍
BemiDB 是一个针对分析优化的 Postgres 读取副本。它包含一个单一的二进制文件,可以无缝连接到 Postgres 数据库,以压缩的列式格式复制数据,并允许使用其 Postgres 兼容的分析查询引擎运行复杂的查询。
BemiDB 的特点包括:
- 性能:运行分析查询比 Postgres 快 2000 倍。
- 单一二进制:由一个可以在任何机器上运行的单个二进制文件组成。
- Postgres 复制:自动同步 Postgres 数据库的数据。
- 压缩数据:使用开放列式格式,表压缩比为 4x。
- 可扩展存储:存储与计算分离,支持本地磁盘或 S3。
- 查询引擎:针对分析工作负载优化的查询引擎。
- Postgres 兼容:与 Postgres 生态系统的服务和工具集成。
- 开源:在 OSI 批准的许可下发布。
2. 项目快速启动
首先,安装 BemiDB:
curl -sSL https://raw.githubusercontent.com/BemiHQ/BemiDB/refs/heads/main/scripts/install.sh | bash
接着,从 Postgres 数据库同步数据:
./bemidb --pg-database-url postgres://postgres:postgres@localhost:5432/dbname sync
然后,启动 BemiDB 数据库:
./bemidb start
在 BemiDB 数据库上运行 Postgres 查询:
# 列出所有表
psql postgres://localhost:54321/bemidb -c "SELECT table_schema, table_name FROM information_schema.tables"
# 查询一个表
psql postgres://localhost:54321/bemidb -c "SELECT COUNT(*) FROM [table_name]"
3. 应用案例和最佳实践
- 运行复杂的分析查询:像使用 Postgres 数据库一样运行复杂的分析查询,而不必担心性能影响和索引。
- 简化数据堆栈:将数据堆栈简化为单个二进制文件,无需复杂设置、数据移动或奇怪的缩写,如 CDC、ETL、DW。
- 与 Postgres 兼容的工具和服务集成:使用 BI 工具、笔记本和 ORM 查询和可视化数据。
- 自动集中所有数据在数据湖仓:使用 Iceberg 表和对象存储上的 Parquet 数据文件。
- 持续归档数据:从 Postgres 数据库中归档数据,而不会影响主数据库。
4. 典型生态项目
BemiDB 可以与多种开源项目集成,例如:
- Apache Iceberg:用于管理大型数据集的元数据。
- Amazon S3:用于存储和管理数据。
- Postgres:作为数据源。
以上是 BemiDB 的基本使用教程,希望能帮助您快速上手该项目。
BemiDB Postgres read replica optimized for analytics 项目地址: https://gitcode.com/gh_mirrors/be/BemiDB
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考