JavaWeb会遇到的GBK、UTF-8、Unicode编码方式知识小结

本文详细对比了GBK编码与UTF-8编码的特点,包括编码方式、占用空间及适用场景,帮助开发者理解不同编码的区别并做出合理选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

GBK编码:

1、是中国国家标准GB2312扩展后的编码方式(汉语拼音guo biao kuo,简称GBK),包含全部中文字符,是为了汉字字符而形成的,在国外IE上不支持,会出现乱码。

2、GBK编码一个中文字符占两个字节。

3、GBK编码用ASCII码(一个字符一字节)表示英文字符;但它也可用两字节表示,用首位区分,首位为1,表示中文字符,用GBK解码;首位为0,表示英文字符,用ASCII码解码。


UTF-8编码:

1、是国际通用编码,通用性强,在国外IE上可以正确显示中文与英文。

2、UTF-8一个英文字符占用一字节,一个中文字符占用三字节;所以在中文字符较多的网页中,使用UTF-8编码较GBK等国标编码占用空间较大,打卡网页的速度更慢。


Unicode编码:

1、国际统一编码,它建立了一个全世界统一的码表。世界上的所有文字,在这张码表中都是唯一的。

2、是Java编程语言的默认编码方式。在程序被编译后,所有字符在.class文件中的编码方式都是Unicode。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值