系列-搞清楚字符编码
Sacredness
优快云不再更新.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
搞清楚字符编码01-编码分类与字符字符图形库
写在前边现在的时间:2019-04-16编码分类我们把所有的编码分成两类:本地编码、万国码本地编码只编码本国(本地区)的文字与符号如ASCII、ISO-8859-1、GBK万国码编码了全世界的文字与字符如utf-8,uft-16字符图形库字符图形库存入了每个符号像素点的显示数据。指挥显示器描出图形数据。...原创 2019-04-16 17:53:12 · 447 阅读 · 0 评论 -
搞清楚字符编码02-ASCII码
引言提到字符编码,首先便是大名鼎鼎的ASCII码,这个编码应该是人类历史上第一个编码,今天仍在使用。原创 2019-04-18 11:41:43 · 1878 阅读 · 0 评论 -
搞清楚字符编码03-ISO-8859-1码
ISO-8859-1码的由来由来一些欧洲国家,它们的语言体系中不仅有26个英语字母符号,还有一些其他的符号。像法语中就有À Â È É Ê Ë Î Ï这样的符号,这些符号并不在ASCII码的编码中。欧洲的这些国家为了使用计算机,便制定出ISO-8859-1码,所以这个编码主要在欧洲国家使用。制定者国际标准化组织(International Organization for Sta...原创 2019-04-21 21:15:34 · 1176 阅读 · 0 评论 -
搞清楚字符编码04-中文编码
并非重点其实中文编码并非学习的重点,因为我们在开发的时候主要用的还非中文编码.常见的中文编码有BIG5、GB2312、GBK、GB18030基本知识点BIG5是繁体中文编码,主要在中国台湾地区使用。GB2312、GBK、GB18030都是简体中文编码。这四种编码全都使用2个字节存储。中国的程序员习惯上把这四种编码统称为DESC码,也就是Double Byte Charechte...原创 2019-04-28 17:42:07 · 435 阅读 · 0 评论 -
搞清楚字符编码05-万国码[1]
万国码的基本知识点万国码是由国际标准组织和统一码联盟共同制定的.万国码有两个版本,第一个版本的最大编码长度是2个字节,第二个版本的最大编码长度是4个字节.万国码的实现万国码的实现分为两个层次:理论编码、实际存储编码理论编码就是抛开计算机不管,通过数据计算得出的编码.实际存储编码就是实际在计算机中存储的编码.理论编码和实际存储编码并不相同,这也是万国码比其他编码难理解的原因...原创 2019-05-28 17:25:58 · 4184 阅读 · 0 评论 -
搞清楚字符编码06-万国码[2]
这篇博客介绍理论编码ucs4编码范围ucs4共有4个字节,理论允许的编码范围为00000000 00000000 00000000 00000000至11111111 11111111 11111111 11111111但最高位没有用,始终是0,所以实际的编码范围为00000000 00000000 00000000 00000000至01111111 11111111 1...原创 2019-05-30 21:20:45 · 1801 阅读 · 0 评论 -
搞清楚字符编码07-万国码[3]
这篇博客介绍万国码中的实际存储编码ucs-2ucs-2是什么ucs2是一种理论编码,ucs-2是一种实际存储编码,它是对ucs2的实现.ucs-2编码有时也称为Unicode编码ucs-2的特点ucs-2每个编码都是2个字节,不变长存储.最多可以有65536个编码.引出utf-8在ucs-2中每个字符都是2个字节,对于汉字来说还好,所在的汉字这两个字节都会用到.但...原创 2019-06-23 12:33:20 · 1207 阅读 · 0 评论 -
搞清楚字符编码08-万国码[4](utf-8)
这篇博客介绍万国码中的实际存储编码utf-8utf-8是什么utf-8是一种实际存储编码它即可以存储理论编码ucs2又可以存储理论编码ucs4变长存储,各个字符编码的长度可能不相同.它是为了解决ucs-2中的浪费问题而产生的.utf-8如何存储ucs2方案范围方案0<x≤70 < x \leq 70<x≤70xxxxx...原创 2019-06-23 12:39:21 · 1801 阅读 · 0 评论 -
搞清楚字符编码09-万国码[5]
这篇博客我们来介绍万国码实际存储编码中的utf-16与utf-32utf-16是什么utf-16是理论编码ucs4的一种实际存储编码基本单元是2个字节变长存储,存储BMP时长度是2个字节,存储的不是BMP时长度为4个字节.utf-16存储ucs4中的BMP此时uft-16存储ucs4的情况就跟ucs-2存储ucs2的情况一模一样.utf-16存储大于BMP的ucs...原创 2019-07-21 16:56:27 · 646 阅读 · 0 评论 -
搞清楚字符编码10-万国码[6]
这篇博客简要介绍一下万国码的BOM信息以及万国码的大小端BOM信息什么是BOM信息BOM信息是一种标示,用于告诉文本编辑器这个文件使用的是什么编码,以及编码使用的大端存储还是小端存储.例如utf-8的BOM信息是EF BB BF,如果保存文件时使用的是UTF-8 with BOM这种编码在文件的最前边就会有这段信息.如果保存时使用的是普通的UTF-8编码就没有这段BOM信息.注...原创 2019-07-21 17:08:05 · 2315 阅读 · 0 评论 -
搞清楚字符编码11-ANSI
ANSI是什么我们经常可以看到ANSI这个东西,比如windows自带的记事本在保存文件时,有一个编码选项就是ANSI编码.ANSI是windows系统下才有的概念.字符集编码可以分为本地编码和万国码ANSI就表示本地编码.操作系统在出厂时ANSI默认指定了一个本地编码,后期我们可以手修改.至此,字符编码的博客暂告一段落,其他知识以后在机会再补充....原创 2019-09-02 20:38:52 · 422 阅读 · 0 评论
分享