一、ISO_8859_1 【扩展 ASCII 码】- - 别名(Latin-1 / Latin1)
- 英语用 128 个符号编码就够了,但是用来表示其他语言,128 个符号是不够的。
- 如:在法语中,字母上方有注音符号,它就无法用 ASCII 码表示。
- 于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号。
- 如:法语中的 é 的编码为 130(二进制 10000010)。
- 这样一来,这些欧洲国家使用的编码体系,可以表示最多 256 个符号。
- ISO8859-1 编码属于单字节的编码,范围是 0 到 255。能表示 256 个字符,向下兼容了 ACSII 。
- 即:在 ASCII 编码的基础上扩展了 127-255 之间位置。
- 编码范围是 0x00-0xFF,涵盖了部分西欧的语言字符。
- 后 128 个称为扩展 ASCII 码。许多基于 x86 的系统都支持使用扩展(或“高”)ASCII。
二、扩展 ASCII 码
- 扩展 ASCII 码将每个字符的第 8 位,用于确定附加的 128 个特殊符号字符、外来语字母和图形符号
三、ISO_8859_1 编码的局限性
- 1、ASCII 码和扩展 ASCII 码只能满足欧洲国家使用的编码体系。
- 2、至于亚洲国家的文字,使用的符号就更多了,汉字就多达 10 万左右。一个字节只能表示 256 种符号,肯定是不够的,就必须使用多个字节表达一个符号。
- 如:简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字。所以,理论上最多可以表示 256 x 256 = 65536 个符号。
- 3、所以,就出现了不同的编码体系。