Parquet Orc CarbonData三种存储格式对比。
特点:
1.都有row group 的概念。没有整个列存储在一个数据结构中。而是按多少行,区分了一下。
2.carbonData 相对于其他两种加了更多的索引和统计信息。
详细内容看图:

本文对比了Parquet、Orc与CarbonData三种存储格式的特点。这些格式都使用了rowgroup的概念,但并未将整列存储于单一数据结构中。CarbonData在此基础上增加了额外的索引和统计信息。
Parquet Orc CarbonData三种存储格式对比。
特点:
1.都有row group 的概念。没有整个列存储在一个数据结构中。而是按多少行,区分了一下。
2.carbonData 相对于其他两种加了更多的索引和统计信息。
详细内容看图:


被折叠的 条评论
为什么被折叠?