再谈日文编码字符显示长度的计算

日文字符编码解析

最新推荐文章于 2023-08-30 17:50:48 发布

最新推荐文章于 2023-08-30 17:50:48 发布 · 219 阅读

·

0

·

本文探讨了日文字符在不同系统环境下的编码表现，通过分析getBytes()方法在Win2K和WinXP系统上的差异，揭示了半角和全角字符的字节占用情况，并深入讨论了如何准确判断日文字符的编码。

将某个日文字符显示出来，无外乎就是去判断是半角还是全角字符，半角的占用一个字节的位置，全角的占用两个字节的位置。最初的想法就是直接根据getBytes("UTF-8").length来判断。结果经过仔细的测试，发现有一小部分的字符并不符合预期的规律。还是老老实实的拿出UNICODE编码表，把日文字符所有的情况都“扣”了出来。
调查过程中发现getBytes().length这个方法挺有意思的。这个方法跟系统环境有关（采用系统默认的编码方式做转换），大家肯定都知道。但是，同样是中文环境，对于同样的一个中文系统不认识的特殊字符（会显示出?），Win2K的结果是1，而WinXP的结果是2。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。