1.介绍
1.范围
无符号,\u0000-\uffff, 0 - 2^16 ,0~65536
2.内部
采用unicode字符集 utf-16编码
3.面对特殊字符时,unicode无法表示时
采用 高位和低位 使用4字节来表示
2.问题
1.字符串里面存什么?
char[]
2.String.length 可以代码 字符串含有的字符个数吗?
不行,要用String.codePointCount()来表示,因为很多偏僻字非ucs-2编码集能表示,所以采用 高位代理对和低位代理对和一起来表示一个字符,而String.length代表的是char[]长度,所以不能用来表示!
3.char是否有2^16字符?
理论上没有,因为还有代表高位代理对和低位代理对的占的 码值
4.是否可以表示汉字?
可以表示常用汉字! 特殊汉字 不是采用unicode usc-2表示的!
java-基础-1.3 char类型
最新推荐文章于 2025-04-24 15:23:21 发布
本文介绍了Unicode编码原理及其在UTF-16中的应用,探讨了如何处理特殊字符,并解释了Java中String类的长度属性与实际字符计数的区别。
6646

被折叠的 条评论
为什么被折叠?



