
文字编码
第二月
这个作者很懒,什么都没留下…
展开
-
汉字的编码
中国大陆的汉字编码总体上可以分为三个层次: GB2312-80 全称是GB2312-80《信息交换用汉字编码字符集基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。P-Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。原创 2006-09-04 15:46:00 · 1859 阅读 · 0 评论 -
Unicode、UCS与UTF
Unicode:如果把各种文字编码形容为各地的方言,那么Unicode就是世界各国合作开发的一种语言。在这种语言环境下,不会再有语言的编码冲突,在同屏下,可以显示任何语言的内容。Unicode将世界上所有的文字用2个字节统一进行编码。但是2个字节最多能够表示65536个编码,够用吗?看来这就是统一编码的神奇之处,比如:韩国和日本的大部分汉字都是从中国传播过去的,字型是完全一样的。原创 2006-09-04 15:01:00 · 1594 阅读 · 0 评论 -
制作GBK与Unicode的对照表
前段时间,在所参与的项目中遇到了一个unicode与gb之间转码失败的问题,一些不常用汉字的编码都被转成了“??”,这些汉字没有显示出来,于是自己对相关的问题做了一些研究并最终使问题得以解决。现在就结合前面两篇的unicode与GB方面的基本原理,介绍这种制作GBK-Unicode编码对照表的方法。 Java的字符串String类功能强大,不但能进行一些基本的字符串操作,原创 2006-09-04 16:43:00 · 1853 阅读 · 0 评论 -
bin to asc
#include #include int main(int argc, char **argv) { FILE *fdb = NULL; FILE *fda = NULL; unsigned char c; char h[2]; if (argc!=2) return -1; if (NULL == argv[1]) return -1; fdb = fopen(argv[1原创 2008-08-18 18:00:00 · 912 阅读 · 0 评论 -
asc to bin
#include #include int main(int argc, char **argv) { FILE *fdb = NULL; FILE *fda = NULL; char c[2]; char i; if (argc!=2) return -1; if (NULL == argv[1]) return -1; fdb = fopen(argv[1], "wb")原创 2008-08-18 18:01:00 · 859 阅读 · 0 评论 -
moon.png
89504e470d0a1a0a0000000d4948445200000050000000500802000000017365fa0000000467414d410000b18f0bfc610500003eca49444154785e6d7c055c54e9d7ff1834d3dd09430f0343370cdd5d2a822065102aa808164a181828601076070a0aa8原创 2008-09-03 15:00:00 · 4215 阅读 · 0 评论