Hbase的备份通常使用distcp进行批量拷贝,在我的尝试中经常出现各种问题,甚至table lost,貌似对s3的支持有点混乱。
hbase-backup工具提供了非常灵活的hbase数据导入/导出方式:
http://issues.apache.org/jira/browse/HBASE-897
下载完0.19版本的hbase-backup后即可使用ant进行编译。使用挺方便。
导出:
bin/hadoop com.mahalo.hadoop.hbase.Exporter -output backup -table text -columns text_flags: text_data:
导入:
bin/hadoop com.mahalo.hadoop.hbase.Importer backup/backup.tsv text
该工具可以用于不同表格之间的整合以及数据库版本升级等。