UTF-8就是在互联网上使用最广的一种unicode的实现方式
0000 0000-0000 007F | 0xxxxxxx0000 0080-0000 07FF | 110xxxxx 10xxxxxx
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-001F FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
0020 0000-03FF FFFF | 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
0400 0000-07FF FFFF | 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
本文详细介绍了UTF-8编码规则,展示了不同Unicode字符如何映射到字节序列中。通过具体的编码范围和位模式,读者可以了解到UTF-8是如何高效地在网络上传输各种语言文字的。
6233

被折叠的 条评论
为什么被折叠?



