hive分隔符引发的坑

在使用Sqoop从SQL Server导入数据到Hive时,由于BPM系统数据中的string2字段包含Hive默认分隔符' ',导致数据切分错误,产生额外的空值行和数据混乱。通过添加sqoop参数`--hive-drop-import-delims`,成功解决了分隔符问题,使数据条目与原始数据保持一致。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hive分隔符引发的坑

​ 这两天在做公司 BPM 系统数据分析的工作,前期需要将 BPM 系统的数据导入到 HDFS 上,BPM 系统数据存储在 SQL Server 上,导入数据工具选择 Sqoop ,按照 Sqoop 操作惯例,需要先下载相应的驱动 jar 包,这里是网上下载的 mssql-jdbc-7.4.1.jre8.jar(图示上为 sql server 的驱动 jar 包,下为 mysql 的驱动 jar 包);
在这里插入图片描述

​ 然后将下好的 jar 包上传到 Sqoop 的 lib 目录下;

​ 打开Hadoop相关进程,就可以执行数据的导入和导出操作了;

#App_K3Flow表数据同步(全量)
 /opt/module/sqoop/bin/sqoop import \
--connect "jdbc:sqlserver://172.31.xxx.xxx:1433;DatabaseName=kcpm" \
--username xx \
--password xxxxxx \
--target-dir /warehouse/data/App_K3Flow_test \
--delete-target-dir \
--query &
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值