一直想做点什么,但发现自己能力上还是有好多不足,甚至感觉自己算不上是一个合格的程序员。 自己应该要做点什么了。不能在那乱想乱猜。 从哪里做起呢?实践是检验一切的真理 。好吧,我的扫盲一路从现在出发。 自己知识的储备决定了我能做什么,现在要做的就是让自己成为一个合格的程序员。而blog 算是鞭打扫自己盲的一个动力。
好吧,那就从字符和字符串说起。(内容来自 C++ 反汇编与逆向分析技术揭秘)
在C++ 中 以'\0'作为字符串的结束标记, 每个字符都记录在一张表中, 他们各自对应一个唯一的编号, 系统通过 这个编号查找到对应的字符并显示, 字符表中的编号便是字符的编码格式。
字符的编码 : C++中的编吗格式分两种 ASCII(一字节) 和Unicode(二字节) 两种 出现乱码 是因为缺少某种语种的字符表
汉字编码 : 汉字编码有些特殊 ASCII 和Unicode 都可以表示汉字, 但是他们对汉字的编码格式各不相同,所以存储同样的汉字但在内存中的编码是不同的。
ASCII 使用的是 GB2312-80 保存了6763 个常用汉字编码 两个ASCII 码标识一个汉字(source insight 中利用这点 进行 字符输入分析)
Unicode 使用的是 UCS-2 编码格式 最多保存 65536 个 但汉字太多,UCS-4 采用和ASCII 类似的方式 两个Unicode 编码标识一个汉字
blog.youkuaiyun.com/poechant/article/details/8034749
附上个自己看的别人扫盲的不错,学习下。
开始----------------------