数据湖(iceberg,hudi,delta)三剑客生产环境选型

数据湖产品选择:Iceberg、Hudi与Delta的场景应用

针对数据湖的功能,大致都一样,比如ACID,时间旅行,流批一体等等,基础的功能和对比网上很多,但都能支持通用功能,唯一不一样的是,hudi支持数据库特性,具体我们就不在这里叙述了。

在生产环境如何选择:我们对系统一般分为,自研系统,公司内部使用,客户使用等不同场景。

先介绍一下各个产品的定位:

Apache Iceberg 是一种用于大型分析数据集的开放表格格式。Iceberg 使用类似于 SQL 表的高性能表格式将表添加到计算引擎中,包括 Spark、Trino、PrestoDB、Flink、Hive 和 Impala。

Apache Hudi是下一代流数据湖平台。 Apache Hudi 将核心仓库和数据库功能直接引入数据湖。Hudi 提供事务高效的更新插入/删除高级索引流式摄取服务、数据

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值