sqoop工具将数据从Hive导出到mysql中文乱码问题
常用从hive导出数据到mysql的sqoop执行语句:
bin/sqoop export \
--connect jdbc:mysql://bigdata01:3306/etl \
--username root \
--password 123456 \
--table grade \
--num-mappers 1 \
--export-dir /user/hive/warehouse/etl.db/grade/ \
--input-fields-terminated-by "\t"
当我使用的时候遇到下数据导出到MySQL后中文字符乱码问题,中文全变成了问号????

当时感觉听懵的,然后就去网上找了不少的文章,特别是在mysql中修改表的字段的字符集的,都试过了。最后发现了最直接的解决方法,只需要在指定连接的时候加上双引号,并且加上编码字符集utf8就可以解决了!!
修改后的sqoop将hive数据导出到MySQL数据库的指令为:
bin/sqoop export \
--connect "jdbc:mysql://bigdata01:3306/etl?useUnicode=true&characterEncoding=utf-8" \
--username root \
--password 123456 \
--table grade \
--num-mappers 1 \
--export-dir /user/hive/warehouse/etl.db/grade/ \
--input-fields-terminated-by "\t"

只需要指定连接的时候加上双引号和字符集编码就可以了,不需要去修改mysql中表的字段的字符集!亲测。
希望一键三连
本文介绍了如何通过调整SQOOP命令来避免从Hive导出数据到MySQL时的中文乱码问题,重点在于在连接字符串中添加useUnicode和characterEncoding=utf-8参数。只需在连接时添加双引号并指定字符集即可,无需修改MySQL表字段。
692

被折叠的 条评论
为什么被折叠?



