字符编码 Unicode UTF-8 UTF-16 UTF-32 ANSI

本文深入浅出地介绍了字符编码的概念,包括ASCII、Unicode及其几种常见的实现形式:UTF-8、UTF-16和UTF-32。解释了这些编码方式的特点及应用场景,如UTF-8在互联网上的广泛应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


Unicode UTF-8 UTF-16 UTF-32 ANSI  

 

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

http://fly-ever.iteye.com/blog/519976

http://www.cnblogs.com/skyaspnet/archive/2011/02/18/1957770.html

http://zh.wikipedia.org/wiki/Unicode%E5%AD%97%E7%AC%A6%E5%B9%B3%E9%9D%A2

关键理解点:

1.UNICODE只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。

      并对每一个字符进行统一编码,保证唯一性;UCS-2 最多使用2个字节表示,UCS-4 最多使用4个字节表示;

    每一个字符的编码全球唯一;

2.UTF-8 UTF-16 UTF-32 是对UNICODE 存储的实现之一;就像虚函数一样。UNICODE 定义了 虚函数

   UTF-8 等实现了该虚函数。

UTF-8 多字节,变长编码;互联网较多,XML

UTF-16 定长编码 2字节  JAVA,WINNT 都市

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值