sqoop工具将数据从Hive导出到mysql中文乱码问题

原创已于 2022-04-17 11:40:37 修改 · 4.6k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#hive #sqoop #mysql

于 2022-04-16 19:30:20 首次发布

数据同步工具专栏收录该内容

4 篇文章

订阅专栏

本文介绍了如何通过调整SQOOP命令来避免从Hive导出数据到MySQL时的中文乱码问题，重点在于在连接字符串中添加useUnicode和characterEncoding=utf-8参数。只需在连接时添加双引号并指定字符集即可，无需修改MySQL表字段。

sqoop工具将数据从Hive导出到mysql中文乱码问题

常用从hive导出数据到mysql的sqoop执行语句：

bin/sqoop export \
--connect jdbc:mysql://bigdata01:3306/etl \
--username root \
--password 123456 \
--table grade \
--num-mappers 1 \
--export-dir /user/hive/warehouse/etl.db/grade/ \
--input-fields-terminated-by "\t"

当我使用的时候遇到下数据导出到MySQL后中文字符乱码问题，中文全变成了问号？？？？
在这里插入图片描述

当时感觉听懵的，然后就去网上找了不少的文章，特别是在mysql中修改表的字段的字符集的，都试过了。最后发现了最直接的解决方法，只需要在指定连接的时候加上双引号，并且加上编码字符集utf8就可以解决了！！
修改后的sqoop将hive数据导出到MySQL数据库的指令为：

 bin/sqoop export \
--connect "jdbc:mysql://bigdata01:3306/etl?useUnicode=true&characterEncoding=utf-8" \
--username root \
--password 123456 \
--table grade \
--num-mappers 1 \
--export-dir /user/hive/warehouse/etl.db/grade/ \
--input-fields-terminated-by "\t"