sqoop数据导入hive 遇到的问题

本文介绍了在使用sqoop将数据导入hive时可能遇到的几个问题及解决方案,包括:jackson版本冲突、java-json.jar缺失、行分隔符和列分隔符导致的数据不一致问题,以及null字段填充符的指定。同时,针对导入数据中的中文乱码问题,给出了设置字符编码的解决方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.ERROR exec.DDLTask: java.lang.NoSuchMethodError: com.fasterxml.jackson.databind.ObjectMapper.readerFor(Ljava/lang/Class;)Lcom/fasterxml/jackson/databind/ObjectReader;

造成的原因:sqoop与hive使用的jackson包的版本冲突导致(表象是没有这个方法)

解决方法:将sqoop的lib目录下jackson*.jar包备份,hive的lib目录下的jackson相关jar包拷贝到sqoop的lib目录下。

2.创建job的时候报错:

Exception in thread "main" java.lang.NoClassDefFoundError: org/json/JSONObject

造成的原因:这是因为sqoop缺少java-json.jar包(表象是没有这个类).

解决方法:

java-json.jar下载

3.

Sqoop从oracle导入数据到hive,示例:

sqoop import --connect jdbc:oracle:thin:@oracle-host:port:orcl --username name--password passwd --hive-import -table tablename  


如果不加其他参数,导入的数据默认的列分隔符是'\001',默认的行分隔符是'\n'。

这样问题就来了,如果导入的数据中有'\n',hive会认为一行已经结束,后面的数据被分割成下一行。这种情况下,导入之后hive中数据的行数就比原先数据库中的多&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值