1、sqoop 默认开启4个split,如不指定map=1;可能会导致数据重复;
2、sqoop import 开启并发,需指定并发字段,避免数据重复;
博客介绍了Sqoop使用时避免数据重复的方法。一是默认开启4个split,若不指定map=1可能导致数据重复;二是sqoop import开启并发时,需指定并发字段来避免数据重复。
1、sqoop 默认开启4个split,如不指定map=1;可能会导致数据重复;
2、sqoop import 开启并发,需指定并发字段,避免数据重复;
832
138
955

被折叠的 条评论
为什么被折叠?