
计算机基础
那海蓝蓝
这个作者很懒,什么都没留下…
展开
-
深入理解64-bit (一)
1 为什么要使用64-bit 1.1 概述 当前,“64-bit”是比较流行的一个词,许多人提到“64-bit”,就会想起高性能和大数据量。一时间,似乎“64-bit”成为了性能瓶颈的救命稻草。 “64-bit”的计算机真的能带来性能的提升吗?为什么“64-bit”的计算机能带来性能提升?不远的将来,我们将从“32-bit”的时代完全进入到“64-b原创 2017-03-13 18:45:25 · 5472 阅读 · 0 评论 -
计算机是如何处理中文的(九)
2.5. 编程注意事项 编程或构造一个系统前,通常需要注意国际化和本地化的问题。 维基百科上讲 [1]: 国际化是指在设计软件,将软件与特定语言及地区脱钩的过程。当软件被移植到不同的语言及地区时,软件本身不用做内部工程上的改变或修正。本地化则是指当移植软件时,加上与特定区域设置有关的信息和翻译文件的过程。国际化和本地化之间的区别虽然微妙,但却很重要。国际化意味着产品有适用于任何地原创 2017-03-13 18:47:48 · 373 阅读 · 0 评论 -
计算机是如何处理中文的(八)
2.4.2. 应用软件 在操作系统之外的软件,都在此处称为应用软件。 本文以数据库为例,说明应用软件是如何支持中文的。 冯诺依曼体系,构造了“外存->内存->CPU”的体系结构。所以,信息处理的一个环节,就是存储。数据库要存储数据,普通文本编辑器也要保存数据,这样,信息基本上都要“持久化”存储起来。 从外存到内存,文件被打开,数据被读入,读入后,就要被处理,这就有个识别的问题原创 2017-03-13 18:47:43 · 602 阅读 · 0 评论 -
计算机是如何处理中文的(七)
2.4.1.2. Linux系列 在linux上执行locale命令,可以得出类似如下内容: [hxli@localhost ~]$ locale LANG=zh_CN.GB18030 LC_CTYPE="zh_CN.GB18030" LC_NUMERIC="zh_CN.GB18030" LC_TIME="zh_CN.GB18030"原创 2017-03-13 18:47:40 · 337 阅读 · 0 评论 -
计算机是如何处理中文的(六)
2.4. 系统软件 2.4.1. 操作系统 操作系统支持中文,其原理,本质上在于,中文的每个字不够用单字节表示,汉字机内码因此是多字节字符组成,而机内码是操作系统识别和处理符号的基本单元,所以,汉字机内码支持了汉字能被表示、识别、处理。 “汉字在计算机中的基本处理过程”一节,讲述了汉字被计算机处理的过程。本节所讲述的,将是操作系统可见的、和中文(精确地说,应该是:任原创 2017-03-13 18:47:35 · 1093 阅读 · 0 评论 -
计算机是如何处理中文的(四)
2.2. 机内码 汉字的机内码是指在计算机中表示一个汉字的编码。 汉字在计算机内部其内码是唯一的。 我们国家定义了类似ASCII码的“国标码”,这是国家级别的标准,需要世人来遵守。所以,计算机也直接遵守这个标准就好了,为什么还产生出一个“机内码”的东西来? 因为:汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。 例如:有两个字节的内原创 2017-03-13 18:47:24 · 659 阅读 · 0 评论 -
计算机是如何处理中文的(三)
2. 相关概念和问题 2.1. 字符集 2.1.1. 基本概念 1) character repertoire:一组字符的集合;与character encoding无关;有默认的COLLATION;这是一个有形的符号集合 2) character encoding form:对特定character repertoire进行计算机编码原创 2017-03-13 18:47:16 · 562 阅读 · 0 评论 -
计算机是如何处理中文的(二)
1.2. 汉字在计算机中的基本处理过程 汉字的处理原理 1) 首先,从外设(如键盘)输入的汉字经过外设管理模块,变换成机内码。 2) 其次,经字模检索程序,查到机内码对应的点阵信息在字模库的地址。 3) 第三,从字库中检索出该汉字点阵信息。 4) 第四,利用显示驱动程序将这些信息送到显示卡的显示缓冲存储器中。 5)原创 2017-03-13 18:47:11 · 3105 阅读 · 0 评论 -
计算机是如何处理中文的(一)
1. 问题提出 1) 计算机(电子设备)是为什么会处理汉字? 2) 为什么在中文操作系统中,使用一些软件,有时会有乱码? 3) 编写程序时,为什么要注意国际化的问题? 4) 少数民族的文字能被计算机处理吗? 1.1. 概述 计算机诞生的时候,完全基于英文环境(计算机能处理的是数值型和字符型数据,这些数据是由ASC原创 2017-03-13 18:47:03 · 3591 阅读 · 0 评论 -
深入理解64-bit(七)
4 小结 优缺点 32-bit 64-bit 实例或备注 硬件 涉及对象 子项 寄存器[1] 个数 少[2] 多[3] 增加的64位寄存器数量 直接原创 2017-03-13 18:46:46 · 612 阅读 · 0 评论 -
深入理解64-bit(五)
2 “32-bit”与“64-bit”的问题 2.1 “32-bit”与“64-bit”的兼容性问题 “32-bit”的应用程序需要得到操作系统、编译器、链接库等的支持才能在特定目标平台上运行。通常的关系可以参看下表: 表2 编译器和操作系统关系 32-bit操作系统 64-bit操作系统原创 2017-03-13 18:46:07 · 406 阅读 · 0 评论 -
深入理解64-bit(四)
1.3.4 编译器、链接库、库 程序员写的代码通常需要编译,只有编译后,才可生成目标机器上可执行的二进制代码,因此,编译器是否支持64-bit也制约着程序的运行。 比如,在“64-bit”的Linux系统上,执行如下命令,如果可以看到类似“Reading specs from /usr/lib64/gcc/x86_64-unknown-linux-gnu/3.4.3/specs”的原创 2017-03-13 18:46:02 · 434 阅读 · 0 评论 -
深入理解64-bit(三)
1.3 “64-bit”相关因素 “64-bit”甚至“128-bit”,在实际应用中,这些概念究竟和什么相关? 试想,假如拿一个32位的操作系统在64-bit的硬件上运行,是否可以? 是否我们编译好一个windows程序,就可以在任何windows操作系统上运行? Java吹的“一次编译,到处运行”是否真如其所言,如是,这个又是什么道理? 其实,“64-bit”这个概念是架构在硬原创 2017-03-13 18:45:57 · 998 阅读 · 0 评论 -
深入理解64-bit (二)
1.2 “64-bit”的本质 1.2.1 什么是“64-bit” “32-bit”是指在并行情况下可被处理或传输的bit位的个数,也可指在某种数据格式下一个简单元素所使用的bit位的个数,这些个数,就是32个。这个术语被用来表示微处理器上寄存器的宽度。 同理,“64-bit”,就是CPU上寄存器可存储64个bit表示的数。 1.2.2 “64-bit原创 2017-03-13 18:45:42 · 3855 阅读 · 0 评论 -
计算机是如何处理中文的(十)
3. 附录 3.1. local的一些知识 locale把按照所涉及到的文化传统的各个方面分成12个大类,这12个大类分别是: 1、语言符号及其分类(LC_CTYPE) 2、数字(LC_NUMERIC) 3、比较和排序习惯(LC_COLLATE) 4、时间显示格式(LC_TIME) 5、货币单位(LC_MONETARY) 6、信息主要是提示信息,错误信息, 状态信息,原创 2017-03-13 18:47:51 · 317 阅读 · 0 评论