可以看到Iceberg处于,数据存储之上,计算引擎之下,中间的这个部分。
然后我们再来看,主要是iceberg是表格式的,这里他在存储之上,在计算引擎之下,这里的计算引擎可以是spark,如果类比hive,那么iceberg也提供了类似表格的管理方式。
然后继续来看,这里iceberg,我们对比一下hive来说,因为Netflix公司,就那个拍电影的公司,之前用的也是hive处理,但是发现了一个问题,
因为我们知道hive支持数据的分区,分区其实就是一个个的目录对吧,对应他在hdfs上的一个个的目录,比如我们要