- 如何存数字?
十进制转二进制即可--->又用十六进制表示二进制
- 为什么又用十六进制表示二进制呢?
因为二进制写起来太慢了,011110001011010(二进制)=>3C5A(十六进制),这样表示要简洁得多。
- 如何存字符?
转成数字不就OK了?
- 啥是UTF8? 说来话长!
- 如何存储a b c 1 2 3 ?
用0~127表示所有符号
48~~57表示数字符号
65到90表示大写字母
97到122表示小写字母
- 中国人开始用电脑了,怎么表示中文呢?
简单,还是编号!中国国家标准局来编,名称为「国标2312]
用 0000~FFFF 表示汉字
- 中国人的名字里有生僻字,怎么表示生僻字、繁体字、韩文呢?
微软出手了,微软推出了一个国标扩展,简称GBK。含21886个汉字和图形符号,收录了中日韩
使用的几乎所有汉字完全兼容GB2312。依然使用16 位(两字节),后来国标局推出GB18030取代
GBKGB18030 不兼容GB2312
- 网页里有藏文、泰文!怎么办……显示不了啊?
简单,继续编号啊!这回,一次解决全世界的需求!!!
铛铛铛铛--->万国码Unicode
已收录13万字符(大于16位),全世界通用以后还会继续扩充,不会停止。已收录13万字符(大于16位),全世界通用以后还会继续扩充,不会停止。
缺点
- 两个字节不够用,每个字符要用三个及以上字节这样所有文件都扩大50%,不划算那怎么办?
虽然用Uni code但存的时候偷懒,这样行不行?
UTF一8 就被发明出来了
鸡贼的存法
存储「a l
a对应的 Unicode 编号为97,十六进制为61
Unicode直接存:000000000000000001100001
UTF-8偷懒存法:01100001
三字节变一字节,比GBK 还省
存储「你」
你对应的 Unicode 编号为4F60
Unicode 直接存:000000000100111101100000
UTF-8偷懒存法:111001001011110110100000
还是三字节,没有省,但是字母都能省一点.
UTF-8 中8的意思是最少可用8位存一个字符
- 到底如何存字符呢?
那就是编号啊,然后存编号!
本文为$Iron的原创文章,著作权归本人和饥人谷所有,转载务必注明来源