表或者字段有中文的时候需要修改hive的元数据库的设置。
以mysql为例子,当mysql的字符集设置成utf8的时候使用hive会有问题,详细见hive的wiki。
所以当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1。
为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。
修改字段注释字符集
alter table COLUMNS modify column COMMENT varchar(256) character set utf8;
修改表注释字符集
alter table TABL_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
最后别忘记修改hive的jdbc连接,将字符集修改为utf8,如
javax.jdo.option.ConnectionURL
jdbc:mysql://192.168.0.128:3306/hive?characterEncoding=UTF-8
本文介绍如何配置Hive以正确存储包含中文的表和字段注释。通过调整MySQL字符集及修改特定字段的字符集为UTF-8,确保中文信息能够被正确保存。
2207

被折叠的 条评论
为什么被折叠?



