针对数据湖的功能,大致都一样,比如ACID,时间旅行,流批一体等等,基础的功能和对比网上很多,但都能支持通用功能,唯一不一样的是,hudi支持数据库特性,具体我们就不在这里叙述了。
在生产环境如何选择:我们对系统一般分为,自研系统,公司内部使用,客户使用等不同场景。
先介绍一下各个产品的定位:
Apache Iceberg 是一种用于大型分析数据集的开放表格格式。Iceberg 使用类似于 SQL 表的高性能表格式将表添加到计算引擎中,包括 Spark、Trino、PrestoDB、Flink、Hive 和 Impala。
Apache Hudi是下一代流数据湖平台。 Apache Hudi 将核心仓库和数据库功能直接引入数据湖。Hudi 提供表、事务、高效的更新插入/删除、高级索引、流式摄取服务、数据
数据湖产品选择:Iceberg、Hudi与Delta的场景应用

最低0.47元/天 解锁文章
322

被折叠的 条评论
为什么被折叠?



