字符编码
文章平均质量分 76
legoe
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题: 问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢? 我很早前就发现Unicod转载 2012-02-26 20:16:41 · 387 阅读 · 0 评论 -
符号编码-ASCII、Unicode、Unicode big endian、UTF-8之间的关系
1. ASCII 码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位( bit )有 0 和 1 两种状态,因此八个二进制位就可以组合出 256 种状态,这被称为一个字节( byte )。也就是说,一个字节一共可以用来表示 256 种不同的状态,每一个状态对应一个符号,就是 256 个符号,从 0000000 到 11111111 。 上个世纪 60 年代,转载 2012-02-26 11:30:42 · 703 阅读 · 0 评论 -
UltraEdit编码问题研究
UltraEdit是一个非常强大的工具,但是,工具太强大了就会变成一个双刃剑,用好了是好工具,用不好可能会存在很多的疑惑,在编码方面UltraEdit存在一写令人费解的问题,本人做了一点点研究,与大家分享。 主要的问题来源于UTF-8的处理。 Unicode规范中推荐的标记字节顺序的方法是BOM(Byte Order Mark) UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码转载 2012-02-26 13:34:22 · 1107 阅读 · 0 评论
分享