[Java 基础]客户端,服务器编码理论基础

本文介绍了几种常见的编码集,包括ISO8859-1、GB2312、GBK、UNICODE及UTF-8,并详细解释了URL编码如何解决HTTP协议仅支持ISO8859-1的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、常见的编码集。

ISO8859-1:最为古老的编码,计算机初期出现即使用的编码集。引文字母,数字以及常见的可见字符。一个字节两个字符去单独编码。

GB2312:计算机引入中国后,将ISO8859-1拓展的,包括最为基本的2312个汉字的编码,两个字节单独编码。

     -----GBK编码:由GB2312延拓的编码集。仍然两个字节单独编码。

UNICODE:因为全世界语言文字使用不一,为了统一而进行编码的编码集。

           并不兼容GB2312或者GBK编码或者其他的编码,只是在兼容ISO8859-1的基础上对世界上所有可见字符做出的编码。

     -----UTF-8:由UNICODE拓展而来,3个字节单独编码。

 

二、URL编码

为了解决HTTP协议只支持ISO8859-1编码,不能支持中文的问题,使用URL编码解决问题。

比方说:在页面中使用GET请求方式,携带参数“中国”,编码方式GB2312或者GBK

将单个的中文字符(两个字符8个二进制文字)以字节方式展现(“中”:0101 1010 1010 0010),这样,得到其GB2312编码的底层编码;

‚传递到浏览器,使用URL编码,将底层的二进制文字进行16进制进行编码(“中”:2c 3d)这样比方说,然后在每个字符前面加上“%”。

ƒ从而保证了中文字符的可达性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值