为什么要合并region?
由于写缓存中的store(列族存储文件)每次刷写都会产生一个storeFile(hdfs上的列族存储文件),同一条数据的不同版本或不同标记可能分布在不同的storeFile中,每次查询数据时需要遍历多个storeFile。为了减少hdfs上storeFile的个数,以及清理掉过期和删除的数据,会进行storeFileCompact。
Compaction 分为两种,分别是 Minor Compaction 和 Major Compaction。Minor Compaction
会将临近的若干个较小的 storeFile 合并成一个较大的 storeFile,但不会清理过期和删除的数据。
Major Compaction 会将一个 Store 下的所有的 storeFile 合并成一个大 storeHFile,并且会清理掉过期
和删除的数据。