- 博客(13)
- 收藏
- 关注
转载 Unicode、GB2312、GBK和GB18030中的汉字
GB18030有两个版本:GB18030-2000和GB18030-2005。GB18030-2000是GBK的取代版本,它的主要特点是在GBK基础上增加了CJK统一汉字扩充A的汉字。GB18030-2005的主要特点是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。本文数一数GB18030中的汉字,也顺便看看其它标准中的汉字。 1 Unicode中的汉字在Unicode 5.0
2009-09-13 23:36:00
1052
转载 GB18030编码研究以及GBK、GB18030与Unicode的映射
GB18030编码研究以及GBK、GB18030与Unicode的映射GB18030有两个版本:GB18030-2000和GB18030-2005。在本文中,没有指明版本的GB18030是指GB18030-2005。本文讨论了以下问题:GB2312有682个图形符号,都放在1区。GBK的1区有717个图形符号,5区有166个图形符号,一共有883个图形符号。GB18030的1区有728个图形符
2009-09-13 23:35:00
591
转载 字符,字节和编码
字符,字节和编码[原创文章,转载请保留或注明出处:http://www.regexlab.com/zh/encoding.htm]级别:中级摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱码问题”
2008-02-20 21:16:00
316
转载 谈谈Windows程序中的字符编码
谈谈Windows程序中的字符编码写这篇文章的起因是这么一个问题:我们在使用和安装Windows程序时,有时会看到以“2052”、“1033”这些数字为名的文件夹,这些数字似乎和字符集有关,但它们究竟是什么意思呢?研究这个问题的同时,又会遇到其它问题。我们会谈到Windows的内部架构、Win32 API的A/W函数、Locale、ANSI代码页、与字符编码有关的编译参数、MBCS和Uni
2008-02-20 21:14:00
740
转载 浅谈文字编码和Unicode(下)
浅谈文字编码和Unicode(下)3 字符编码模型程序员经常会面对复杂的问题,而降低复杂性的最简单的方法就是分而治之。Peter Constable在他的文章"Character set encoding basics Understanding character set encodings and legacy encodings"中描述了字符编码的四层模型。我觉得这种说法确实可以更清
2008-02-20 21:13:00
1014
转载 字符集编码常识
字符集编码[转] 这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题: 问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢
2008-02-20 21:11:00
417
原创 Sed 常用公式
文本间隔:--------# 在每一行后面增加一空行sed G# 将原来的所有空行删除并在每一行后面增加一空行。# 这样在输出的文本中每一行后面将有且只有一空行。sed /^$/d;G# 在每一行后面增加两行空行sed G;G# 将第一个脚本所产生的所有空行删除(即删除所有偶数行)sed n;d# 在匹配式样“regex”的行之前插入一空行sed /regex/{x;p;x;}#
2008-02-20 21:10:00
988
转载 UNICODE环境设置
UNICODE环境设置 在安装Visual Studio时,在选择VC++时需要加入unicode选项,保证相关的库文件可以拷贝到system32下。 UNICODE编译设置: C/C++, Preprocessor difinitions 去除_MBCS,加_UNICODE,UNICODE 在ProjectSetting/link/output 中设置Entry为wWin
2008-02-20 21:06:00
1204
转载 浅谈文字编码和Unicode(上)
浅谈文字编码和Unicode(上)我曾经写过一篇《谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词》(以下简称《谈谈Unicode编码》),在网上流传较广,我也收到不少朋友的反馈。本文探讨《谈谈Unicode编码》中未介绍或介绍较少的代码页、Surrogates等问题,补充一些Unicode资料,顺带介绍一下我最近编写的一个Unicode工具:UniToy。本文虽然是前
2008-02-20 21:05:00
3362
转载 maven2完全使用手册
maven2完全使用手册<!-- google_ad_client = "pub-8438768637354676"; google_ad_width = 336; google_ad_height = 280; google_ad_format = "336x280_as"; google_
2008-02-20 21:04:00
643
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人