优化 1.在建表时,尽量保证各个列族中的数据同步增长。原因:在region切分时,若列族中的数据稀疏的,会在hdfs上产生小文件。 2.region切分时,按照源代码的切分方式会产生数据倾斜,可以自行设计预分区防止数据倾斜。