百度/Google/网页字符

搜索引擎中文编码解析
本文解析了在百度和Google搜索中文关键词时,地址栏上出现的不同编码形式,包括GB2312、URI及Unicode编码,并介绍了这些编码的具体含义及其转换方式。
下面解释一下在百度、Google搜索中文的关键词时,地址栏上出现的奇怪字符。 百度字符(GB2312) 例如在百度搜索“你好”两个字,会转到一个地址为  http://www.baidu.com/s?wd=%C4%E3%BA%C3 的网页。 密文(GB码16进制):%C4%E3%BA%C3 密文(GB码十进制):50403 47811 明文:你好 百度用的是GB2312的中文编码,是16进制的。GB2312是标准的简体中文编码。“你”字的GB码为C4E3,“好”字的GB码为BAC3。“你好”转换成十进制为50403和47811。 Google字符(URI) 例如在Google搜索“你好”两个字,会转到一个地址为  http://www.google.cn/search?q=%E4%BD%A0%E5%A5%BD 的网页。 密文(URI):%E4%BD%A0%E5%A5%BD 明文:你好 URI全称Uniform Resource Identifier(通用资源标识符)。Internet可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通过URI进行定位。 网页编码(Unicode) 论坛里常玩的一个把戏,就是让你回帖时写一堆像天书一样的奇怪字符,而回帖之后就能看到相应的文字。 密文(Unicode16进制):楼主是个天才 密文(Unicode10进制):楼主是个天才 明文:楼主是个天才 这里使用的是Unicode编码(十进制),Unicode是一种全世界范围的文字编码,网页都支持这种编码。 Alt+数字小键盘 按住Alt键,在任意文本框中,用键盘右边的数字小键盘输入55021,然后松开Alt键,这时你看到了什么? 用同样的方法分别输入“你好”两个字的GB代码(十进制)50403、47811,这时你将在文本框中看到这两个字。 注意在qq的对话框中,要使用Unicode代码(十进制)20320、22909。

转载于:https://www.cnblogs.com/pcx69/p/3661285.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值