(一) unicode编码
1.unicode编码是一种在计算机上使用的字符编码
2.unicode为每种语言中的每个字符都设定了统一并且唯一的二进制编码,以此来达到满足跨语言,跨平台进 行文本转换和处理的要求
(二)UTF-8
1.UTF-8是一种针对unicode的可变长度的字符编码,又叫万国码这是为了节省空间而优化unicode。我的理解 是UTF-8是unicode的升级版
2.UTF-8可以实现在网页上同一页面显示多种语言
3.UTF-8的编码规则:
(1)对于单字节符号,字节第一位为0,后面7位均为这个符号的unicode码;(对于英文字母,UTF-8编码和 ASCII码是相同的)
(2)对于n(n>1)字节的符号:第一个字节的前n位为1,第n+1位为0,后面字节的前2位一律设为10
剩下的没提到的全为这个符号的unicode码;
学习参考网址:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html