09、ISO-8859-1 / Latin-1 字符集

一、ISO_8859_1 【扩展 ASCII 码】- - 别名(Latin-1 / Latin1)

  • 英语用 128 个符号编码就够了,但是用来表示其他语言,128 个符号是不够的。
    • 如:在法语中,字母上方有注音符号,它就无法用 ASCII 码表示。
  • 于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号
    • 如:法语中的 é 的编码为 130(二进制 10000010)。
    • 这样一来,这些欧洲国家使用的编码体系,可以表示最多 256 个符号
  • ISO8859-1 编码属于单字节的编码,范围是 0 到 255。能表示 256 个字符向下兼容了 ACSII 。
    • 即:在 ASCII 编码的基础上扩展了 127-255 之间位置。
    • 编码范围是 0x00-0xFF,涵盖了部分西欧的语言字符。
  • 后 128 个称为扩展 ASCII 码。许多基于 x86 的系统都支持使用扩展(或“高”)ASCII。

二、扩展 ASCII 码

  • 扩展 ASCII 码将每个字符第 8 位,用于确定附加的 128 个特殊符号字符、外来语字母和图形符号

三、ISO_8859_1 编码的局限性

  • 1、ASCII 码扩展 ASCII 码只能满足欧洲国家使用的编码体系
  • 2、至于亚洲国家的文字,使用的符号就更多了,汉字就多达 10 万左右一个字节只能表示 256 种符号,肯定是不够的,就必须使用多个字节表达一个符号
    • 如:简体中文常见的编码方式是 GB2312,使用两个字节表示一个汉字。所以,理论上最多可以表示 256 x 256 = 65536 个符号
  • 3、所以,就出现了不同的编码体系
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值