增量导入有两种 (需要注意 第二种是不支持直接从 mysql-hive的 第一种可以)
1、--incremental append,根据check-column 和last-value 来更新,这样只是append,也就是说只会同步之前没有的,但是之前的数据如果发生变化是不会更新的。

2、--incremental lastmodified,根据check-column 和last-value 来更新,这样不止append还会修改原来的数据,需要配--merge-key 根据指定字段 将原来数据更新掉

本文介绍了两种增量导入的方法:--incrementalappend 和 --incrementallastmodified。前者仅追加新数据而不更新已有记录;后者则会根据指定条件更新现有数据。文章详细解释了这两种方式的工作原理及其配置选项。
2567

被折叠的 条评论
为什么被折叠?



