1、 replication,
通过类似mysql 主从复制方式进行复制,基于HLog
在应用场景个人感觉比较重要的一点是可以隔离计算分析型的操作和实时性操作带来的影响。
对于DDL操作不做复制,过实时读取hlog中的entry来解析变更的数据然后发送到从集群中去。
2、 distcp,
表数据文件的copy
./hadoopdistcp hdfs://wxlab58:9100/hbase/lsmp_lottery_new_3/ hdfs://wxlab24:9100/hbase/lsmp_lottery_new_3/
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
或者
$ hadoop fs-chmod 777 /user/hadoop