【ZT】关于字符集

UTF8与GBK编码详解
本文详细解析了UTF8和GBK编码的区别与联系,重点介绍了UTF8如何全面兼容GBK编码,以及不同数据库环境下UTF8的具体实现形式。同时,文中还讨论了从GBK到UTF8进行无损转换的可能性。

utf8 全包容了gbk ,并不是说超集和子集;
8i 的数据库 的 utf8 是  4位定长的字符编码;
9i 和以上数据库的utf8   有4位定长AL32UTF8和  不定长的  UTF8  ,都是unicode编码;
其中,utf8 编码中 字符大多是三字节的编码,一个汉字是  3字节的编码;
zhs16gbk  并不是unicode 编码,只是提供了对gbk汉字编码的支持, 一个汉字为双字节;
utf8  对于 zhs16gbk  中的所有编码都有唯一的编码以之对应,所以我说utf8 全包容了bgk;
当然,utf8作为一种unicode 编码,他还提供  global character  的支持;
假如设置得当,从  zhs15gbk 到utf8  是可以实现无损耗的字符转换的;
本人从事汉字冷僻字处理相关的工作,对此还是比较了解的;

转载于:https://www.cnblogs.com/likingzi/p/6702410.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值