hivesql解决中文乱码问题

文章讲述了在初次使用MySQL创建表时遇到的注释乱码问题,原因是HiveSQL默认的Latin1编码与UTF-8不兼容。解决方法是通过ALTERTABLE语句将表的字符集改为UTF-8,确保后续创建的表注释正常显示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题描述:第一次建表并执行发现comment后的注释乱码

执行以下代码并查看

drop database if exists db_1 cascade;

create database if not exists db_1;

create table db_1.tb_user(
    id int comment '编号',
    username string comment '用户名',
    password string comment '密码'
);

desc db_1.tb_user;

结果如下,发现注释乱码

5d47fcf9ea4041ff83e3e9d9dacdc7d9.png

 解决方法;

到MySQL中打开一个窗口,执行以下代码

 

use hive;

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;

alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

回到hivesql中

在执行以下代码

drop database if exists db_1 cascade;

create database if not exists db_1;

create table db_1.tb_user(
    id int comment '编号',
    username string comment '用户名',
    password string comment '密码'
);

desc db_1.tb_user;

先删除,在创建,最后查看结果

结果如下

d7c0850e17304aa2a75e42eb903c468f.png

发现乱码问题已经解决。

乱码原因如下

在hiveSQL中使用的是latin1,此编码一个字符表示一个字节,而一个中文在utf8中占3个字节

在gbk中占两个字符。这里我们修改为utf8。

细节:修改编码后创建的表comment才能变成中午,因为之前的注释已经按latin1编码进行编码了,无法改变。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值