字符编码

        最近领导要求找一下不同字符集编码之间的关系,以便修改我们的产品来支持更多的字符集,查找了半天竟然没有找到直接进行转换的方法,因此特发出查找结果,希望看到此文章并对字符编码转换有所研究的朋友赐教一下。

       要求GB18030-2005和UTF-8之间转换关系。

      查找结果:貌似不能直接进行转换,得借助一个UNICODE编码方式进行中转。目前找到UTF-8和UNICODE之间的简单变换方式,但GB18030和UNICODE之间没有找到除了查表以外更简单的方法。而且之后还考虑了GBK和GB2312有什么办法转到UNICODE去,都没有找到好方法(查表需要的资源较多,特殊原因无法采用)。搜了很多论文好像都是研究怎么加快查表法速度的,而且看了看其它语言实现的方法所调用的库函数都是指定了代码页进行查表。找到的包含关系貌似是下面那样的。GB18030的单字节区,双字节区,四字节区有部分可以简单对应过去,但是其它部分没有找到简单对应方法,希望有所研究的人指教一下,万分感激。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值