目录
1. 数据分析架构演进
从传统的 Hive 和 Hadoop 数据仓库架构向 Lakehouse 架构演进,Lakehouse 架构包括 Presto、Spark、OSS 等,以及湖格式(如 Delta、Hudi、Iceberg)。
Lakehouse 架构提供了更好的操作便利性、查询效率和时效性。
2. Apache Paimon
- Paimon 是一个流式数据湖格式,专为流式数据处理设计,支持大规模更新和真正的流读。
- Paimon 结合了湖存储和
目录
从传统的 Hive 和 Hadoop 数据仓库架构向 Lakehouse 架构演进,Lakehouse 架构包括 Presto、Spark、OSS 等,以及湖格式(如 Delta、Hudi、Iceberg)。
Lakehouse 架构提供了更好的操作便利性、查询效率和时效性。