
杂谈
mayday526
这个作者很懒,什么都没留下…
展开
-
关于ASCII、GBK、Unicode、UTF-8编码
计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节可以表示的最大整数是65535(2^16)。由于计算机是美国人发明的,因此,最早只有127个字母被编码到计算机里原创 2016-08-11 12:14:21 · 561 阅读 · 0 评论 -
学点编码知识又不会死:Unicode的流言终结者和编码大揭秘
如果你是一个生活在2003年的程序员,却不了解字符、字符集、编码和Unicode这些基础知识。那你可要小心了,要是被我抓到你,我会让你在潜水艇里剥六个月洋葱来惩罚你。这个邪恶的恐吓是Joel Spolsky在十年前首次发出的。不幸的是,很多人认为他只是在开玩笑,因此,现在仍有许多人不能完全理解Unicode,以及Unicode, UTF-8, UTF-16之间的区别。这就是我写这篇文章的原转载 2016-08-23 11:09:24 · 666 阅读 · 0 评论 -
编码来源的故事
快下班时,爱问问题的小朋友Nico又问了一个问题: "sqlserver里面有char和nchar,那个n据说是指unicode的数据,这个是什么意思。" 并不是所有简单的问题都很容易回答,就像这个问题一样。于是我答应专门写一篇BLOG来从头讲讲编码的故事。那么就让我们找个草堆坐下,先抽口烟,看看夜晚天空上的银河,然后想一想要从哪里开始讲起。嗯,也许这样开始比较好……很久很久以前,转载 2017-02-06 13:39:17 · 543 阅读 · 0 评论 -
关于各种编码的简要理解
GB2312:两个大于127的字符连在一起时,就表示一个汉字。还重新编码了ACSII,于是被重新编码的两个字节ACSII就是常说的“全角”字符,而原来127以下的那些就叫做“半角”字符。GBK:只要第一个字节大于127,就固定表示这是一个汉字的开始,GBK包括了GB2312的所有内容,同时又增加了近两万个新汉字(包括繁体)和符号。GB18030:增加了几千个少数名族的字原创 2017-02-06 13:40:08 · 769 阅读 · 0 评论 -
重载不应归在多态的范畴内
什么是多态? 简而言之,是指多个属于不同类的对象 对同一方法调用做出不同响应的方式。 (感觉还是有点绕口) 举个例子,所有的动物都能发出声音(把发出声音这一行为抽象为一个方法:sound();),但是不同种类的动物发出的声音却是不一样的(调用sound()方法能够得到不同的响应)。 一谈到多态,很多人就联想到重载(overload),但我并不觉得重载在多态的范畴之内。重载,是指允许存在多个同原创 2017-04-19 14:46:17 · 666 阅读 · 0 评论 -
Fiddler抓包中文乱码问题
作者Eric Lawrence后来推出了一个威力加强版--Fiddler,大概是目前最好用的HTTP分析软件了。作为免费软件,很多方面比收费的HttpWatch、HTTP Analyzer还出色。当然商业软件也有Fiddler不具备的好处,本文主旨不是比较优劣。只说Fiddler,优点主要是:除了能篡改request,还能篡改response;能设置各种过滤器;以独立的方式运行,不转载 2016-09-21 16:21:08 · 47481 阅读 · 0 评论