前言:因为hbase不支持二级索引,如果是后面hive导入hbase需要组合查询的话,那么就的引入phoenix。 hive2hbase三种方式 1.hive和hbase建映射表 直接操作hive表就是操作hbase表 --关系数据导入hbase,进行数据初始化, 但是这种会hive的分区和hbase的预分区不友好,如果只是一般hive表可以使用。 2.使用sparksql操作完hive处理好之后入hbase 这里批量入hbase用的是hbase的api ,这里可以选择scala/ java语言写入hbase,当然python也是ok的。 运用spark读取hive表的数据大批量导入Hbase 3.使用sparksql中的jdbc的方式写入phoenix 见: spark+phoenix 通过jdbc读取表中的数据