字符集:是指字符的集合。
编码集:给字符集中的每一个字符都分配一个整数符号。编码集中字符被分配的整数的编号,不一定就是该字符在计算机中存储的值,具体采用什么二进制整数值要由编码方式决定。
一般采用十六进制(便于书写和阅读)来表示某个字符的编码。
Unicode是字符集,它有三种编码方式,分别是:UTF-8,UTF-16,UTF-32。
UTF-8:
特点:
1、可变长编码,由第一个字节决定该字符编码长度;
2、向下兼容ASCII码。
编码规则:
1、一个字节的编码完全用于ASCII码;
2、大于127的码点都用多字节来编码,多字节包含开头字节和后续字节。
ASCII码:用来表示现代英语和其他西欧语言