ASCII

本文详细介绍了ASCII码的历史背景、编码规则及其应用。从最初的美国标准到成为国际标准,ASCII码覆盖了128个字符,包括控制字符、数字、字母及标点符号。文章还讲解了ASCII码的二进制表示及与其他进制之间的转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

美国信息交换标准代码

  ( American Standard Code for Information Interchange, ASCII )

  在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,象a、b、c、d这样的52个字母(包括大写)、以及0、1、2等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了所谓的ASCII编码,统一规定了上述常用符号用哪些二进制数来表示。

  美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的,标准的单字节字符编码方案,用于基于文本的数据。起始于50年代后期,在1967年定案。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母。

  ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:

  0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

  32~126(共95个)是字符(32sp是空格),其中48~57为0到9十个阿拉伯数字;

  65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

  同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

  后128个称为扩展ASCII码,目前许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。以下为标准ASCII表:

  

BinDecHex缩写/字符解释
00000000000 NUL(null)空字符 
00000001101SOH(start of handling)标题开始
00000010202STX (start of text)正文开始
00000011303ETX (end of text)正文结束
00000100404EOT (end of transm-ission)传输结束
00000101505ENQ (enquiry)请求
00000110606ACK (acknow-ledge)收到通知
00000111707BEL (bell)响铃
00001000808BS (backsp-ace)退格
0000100109HT (horizon-tal tab)水平制表符
0000101010 0A LF (NL line feed, new line)换行键
0000101111 0B VT (vertical tab)垂直制表符 
0000110012 0C FF (NP form feed, new page)换页键
00001101130D CR (carriage return) 回车键
00001110140E SO (shift out)不用切换
00001111150F SI (shift in)启用切换
0001000016 10DLE (data link escape) 数据链路转义
000100011711 DC1 (device control 1) 设备控制1
000100101812 DC2 (device control 2)设备控制2
0001001119 13DC3 (device control 3) 设备控制3
000101002014 DC4 (device control 4)设备控制4 
000101012115 NAK (negati-ve acknowl-edge) 拒绝接收 
000101102216 SYN (synchr-onous idle) 同步空闲
0001011123 17ETB (end of trans. block)传输块结束 
0001100024 18CAN (cancel) 取消 
0001100125 19EM (end of medium)介质中断 
0001101026 1ASUB (substit-ute)替补
0001101127 1BESC (escape) 溢出
0001110028 1CFS (file separat-or) 文件分割符
0001110129 1DGS (group separat-or) 分组符
0001111030 1E RS (record separat-or) 记录分离符
0001111131 1FUS (unit separat-or)单元分隔符
0010000032 20 空格 
0010000133 21 ! 
001000103422 " 
0010001135 23# 
0010010036 24$ 
0010010137 25% 
0010011038 26& 
0010011139 27 ' 
0010100040 28( 
001010014129) 
0010101042 2A* 
00101011432B+ 
0010110044 2C , 
0010110145 2D- 
0010111046 2E . 
0010111147 2F 
0011000048 300 
续表

  

0011000149 31 
0011001050 32 2 
0011001151 33 
0011010052 34 4 
0011010153 35 
0011011054366 
0011011155 37  
0011100056 38 
0011100157 39 9 
0011101058 3A 
00111011593B; 
0011110060 3C 
00111101613D= 
0011111062 3E 
0011111163 3F ? 
0100000064 40 
010000016541A 
0100001066 42  
010000116743C 
0100010068 44  
010001016945E 
010001107046 F 
010001117147G 
0100100072 48 
010010017349I 
0100101074 4A 
01001011754BK 
0100110076 4C  
01001101774DM 
0100111078 4E 
01001111794FO 
0101000080 50 
010100018151Q 
010100108252 R 
010100118353S 
0101010084 54 
0101010185 55 U 
0101011086 56 
0101011187 57W 
0101100088 58 
010110018959 Y 
0101101090 5A 
0101101191 5B 
01011100925C/ 
0101110193 5D 
01011110945E ^ 
0101111195 5F_ 
0110000096 60 
011000019761 a 
0110001098 62 

  续表

  

0110001199 63 
0110010010064d 
01100101101 65 
01100110102 66f 
01100111103 67 
01101000104 68 h 
01101001105 69 
011010101066Aj 
01101011107 6B 
01101100108 6C l 
01101101109 6D m 
011011101106En 
01101111111 6F 
01110000112 70 p 
01110001113 71 
01110010114 72 r 
01110011115 73 
01110100116 74 t 
01110101117 75 u 
01110110118 76v 
01110111119 77 
01111000120 78x 
01111001121 79 
01111010122 7A z 
01111011123 7B{ 
01111100124 7C| 
01111101125 7D} 
01111110126 7E ~ 
01111111127 7F DEL (delete)删除

  常见ASCII码的大小规则:0~9<A~Z<a~z

  1)数字比字母要小。如 “7”<“F”;

  2)数字0比数字9要小,并按0到9顺序递增。如 “3”<“8” ;

  3)字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z” ;

  4)同个字母的大写字母比小写字母要小32。如“A”<“a” 。

  记住几个常见字母的ASCII码大小: “A”为65;“a”为97;“0”为 48。

  另外还有128-255的ASCII字符

字符集简史

  6000年前 象形文字

  3000年前 字母表

  1838年到1854年 Samuel F. B. Morse发明了电报,字母表中的每个字符对应于一系列短的和长的脉冲

  1821年到1824年 Louis Braille发明盲文,6位代码,它把字符、常用字母组合、常用单字和标点进行编码。

  一个特殊的escape代码表示后续的字符代码应解释为大写。一个特殊的shift代码允许后续代码被解释为数字。

  1931年 CCITT标准化Telex代码,包括Baudot #2的代码,都是包括字符和数字的5位代码。

  1890年 早期计算机的字符码是从Hollerith卡片,6位字符码系统BCDIC(Binary-Coded Decimal Interchange Code:二进制编码十进制交换编码)

  60年代 扩展为8位EBCDIC,IBM大型主机的标准

  1967年 美国信息交换标准码(ASCII:American Standard Code for Information Interchange)

  在字符长度是6位、7位还是8位的问题上产生了很大的争议。从可靠性的观点来看不应使用替换字符,

  因此ASCII不能是6位编码,但由于费用的原因也排除了8位版本的方案(当时每位的储存空间成本仍很昂贵)。

  这样,最终的字符码就有26个小写字母、26个大写字母、10个数字、32个符号、33个句柄和一个空格,总共128个字符码。

  ASCII现在记录在ANSI X3.4-1986字符集-用于信息交换的7位美国国家标准码(7-Bit ASCII:7-Bit American National

  Standard Code for Information Interchange),由美国国家标准协会(American National Standards Institute)发布。

  图2-1中所示的ASCII字符码与ANSI文件中的格式相似。

ASCII国际问题

  ASCII是美国标准,所以它不能良好满足其它讲英语国家的需要。例如英国的英镑符号(£)在哪里?

  拉丁语字母表重音符号

  使用斯拉夫字母表的希腊语、希伯来语、阿拉伯语和俄语。

  汉字系统的中国象形汉字,日本和朝鲜。

  1967年,国际标准化组织(ISO:International Standards Organization)推荐一个ASCII的变种,

  代码0x40、0x5B、0x5C、0x5D、0x7B、0x7C和0x7D“为国家使用保留”,而代码0x5E、0x60和0x7E标为

  “当国内要求的特殊字符需要8、9或10个空间位置时,可用于其它图形符号”。这显然不是一个最佳的国际解决方案,

  因为这并不能保证一致性。但这却显示了人们如何想尽办法为不同的语言来编码的。

扩展ASCII

  1981年 IBM PC ROM256个字符的字符集,即IBM扩展字符集

  1985年11 Windows字符集被称作“ANSI字符集”,遵循了ANSI草案和ISO标准(ANSI/ISO 8859-1-1987,简“Latin 1”。

  ANSI字符集的最初版本:

  1987年4月代码页437,字符的映像代码,出现在MS-DOS 3.3

双字节字符集

  双字节字符集(DBCS:double-byte character set),解决中国、日本和韩国的象形文字符和ASCII的某种兼容性。

  DBCS从256代码开始,就像ASCII一样。与任何行为良好的代码页一样,最初的128个代码是ASCII。

  然而,较高的128个代码中的某些总是跟随着第二个字节。

  这两个字节一起(称作首字节和跟随字节)定义一个字符,通常是一个复杂的象形文字。

键盘常用ASCII码

  ESC键 VK_ESCAPE (27)

  回车键: VK_RETURN (13)

  TAB键: VK_TAB (9)

  Caps Lock键: VK_CAPITAL (20)

  Shift键: VK_SHIFT (16)

  Ctrl键: VK_CONTROL (17)

  Alt键: VK_MENU (18)

  空格键: VK_SPACE (32)

  退格键: VK_BACK (8)

  左徽标键: VK_LWIN (91)

  右徽标键: VK_LWIN (92)

  鼠标右键快捷键:VK_APPS (93)

  Insert键: VK_INSERT (45)

  Home键: VK_HOME (36)

  Page Up: VK_PRIOR (33)

  PageDown: VK_NEXT (34)

  End键: VK_END (35)

  Delete键: VK_DELETE (46)

  方向键(←): VK_LEFT (37)

  方向键(↑): VK_UP (38)

  方向键(→): VK_RIGHT (39)

  方向键(↓): VK_DOWN (40)

  F1键: VK_F1 (112)

  F2键: VK_F2 (113)

  F3键: VK_F3 (114)

  F4键: VK_F4 (115)

  F5键: VK_F5 (116)

  F6键: VK_F6 (117)

  F7键: VK_F7 (118)

  F8键: VK_F8 (119)

  F9键: VK_F9 (120)

  F10键: VK_F10 (121)

  F11键: VK_F11 (122)

  F12键: VK_F12 (123)

  Num Lock键: VK_NUMLOCK (144)

  小键盘0: VK_NUMPAD0 (96)

  小键盘1: VK_NUMPAD0 (97)

  小键盘2: VK_NUMPAD0 (98)

  小键盘3: VK_NUMPAD0 (99)

  小键盘4: VK_NUMPAD0 (100)

  小键盘5: VK_NUMPAD0 (101)

  小键盘6: VK_NUMPAD0 (102)

  小键盘7: VK_NUMPAD0 (103)

  小键盘8: VK_NUMPAD0 (104)

  小键盘9: VK_NUMPAD0 (105)

  小键盘.: VK_DECIMAL (110)

  小键盘*: VK_MULTIPLY (106)

  小键盘+: VK_MULTIPLY (107)

  小键盘-: VK_SUBTRACT (109)

  小键盘/: VK_DIVIDE (111)

  Pause Break键: VK_PAUSE (19)

  Scroll Lock键: VK_SCROLL (145)

ASCII码的算法:

  A在ascii中定义为01000001,也就是十进制65,有了这个标准后,当我们输入A时,计算机就可以通过ascii码知道输入的字符的二进制编码是01000001。而没有这样的标准,我们就必须自己想办法告诉计算机我们输入了一个A;没有这样的标准,我们在别的机器上就需要重新编码以告诉计算机我们要输入A。ascii码指的不是十进制,是二进制。只是用十进制表示习惯一点罢了,比如在ascii码中,A的二进制编码为01000001,如果用十进制表示是65,用十六进制表示就是41H。

  在ascii码表中,只包括了一些字符、数字、标点符号的信息表示,这主要是因为计算机是美国发明的,在英文下面,我们使用ascii表示就足够了!但是在汉字输入下面,用ascii码就不能表示了,而汉字只是中国的通用表示,所以如果我们要在计算机中输入汉字,就必须有一个像ascii码的标准来表示每一个汉字,这就是中国的汉字国标码,它定义了汉字在计算机中的一个表示标准。通过这个标准,但我们输入汉字的时候,我们的输入码就转换为区位码,通过唯一的区位码得到这个汉字的字形码并显示出来。当然汉字的区位码在计算机中也是用二进制表示的!

  二进制数转换为十进制数

  二进制数第0位的权值是2的0次方,第1位的权值是2的1次方……

  所以,设有一个二进制数:0110 0100,转换为10进制为:

  下面是竖式:

  0110 0100 换算成 十进制

  第0位 0 * 2^0 = 0

  第1位 0 * 2^1 = 0

  第2位 1 * 2^2 = 4

  第3位 0 * 2^3 = 0

  第4位 0 * 2^4 = 0

  第5位 1 * 2^5 = 32

  第6位 1 * 2^6 = 64

  第7位 0 * 2^7 = 0

  ---------------------------

  100

  用横式计算为:

  0 * 2^0 + 0 * 2^1 + 1 * 2^2 +0*2^3+ 0 * 2^4 + 1 * 2^5 + 1 * 2^6 + 0 * 2^7 = 100

  0乘以多少都是0,所以我们也可以直接跳过值为0的位:

  1 * 2^2 + 1 * 2^5 + 1 * 2^6 = 100

  6.2.2 八进制数转换为十进制数

  八进制就是逢8进1。

  八进制数采用 0~7这八数来表达一个数。

  八进制数第0位的权值为8的0次方,第1位权值为8的1次方,第2位权值为8的2次方……

  所以,设有一个八进制数:1507,转换为十进制为:

  用竖式表示:

  1507换算成十进制。

  第0位 7 * 8^0 = 7

  第1位 0 * 8^1 = 0

  第2位 5 * 8^2 = 320

  第3位 1 * 8^3 = 512

  --------------------------

  839

  同样,我们也可以用横式直接计算:

  7 * 8^0 + 0 * 8^1 + 5 * 8^2 + 1 * 8^3 = 839

  结果是,八进制数 1507 转换成十进制数为 839

  6.2.3 八进制数的表达方法

  C,C++语言中,如何表达一个八进制数呢?如果这个数是 876,我们可以断定它不是八进制数,因为八进制数中不可能出7以上的阿拉伯数字。但如果这个数是123、是567,或12345670,那么它是八进制数还是10进制数,都有可能。

  所以,C,C++规定,一个数如果要指明它采用八进制,必须在它前面加上一个0,如:123是十进制,但0123则表示采用八进制。这就是八进制数在C、C++中的表达方法。

  由于C和C++都没有提供二进制数的表达方法,所以,这里所学的八进制是我们学习的,CtC++语言的数值表达的第二种进制法。

  现在,对于同样一个数,比如是100,我们在代码中可以用平常的10进制表达,例如在变量初始化时:

  int a = 100;

  我们也可以这样写:

  int a = 0144; //0144是八进制的100;一个10进制数如何转成8进制,我们后面会学到。

  千万记住,用八进制表达时,你不能少了最前的那个0。否则计算机会通通当成10进制。不过,有一个地方使用八进制数时,却不能使用加0,那就是我们前面学的用于表达字符的“转义符”表达法。

  6.2.4 八进制数在转义符中的使用

  我们学过用一个转义符'/'加上一个特殊字母来表示某个字符的方法,如:'/n'表示换行(line),而'/t'表示Tab字符,'/''则表示单引号。今天我们又学习了一种使用转义符的方法:转义符'/'后面接一个八进制数,用于表示ASCII码等于该值的字符。

  比如,查一下第5章中的ASCII码表,我们找到问号字符(?)的ASCII值是63,那么我们可以把它转换为八进值:77,然后用 '/77'来表示'?'。由于是八进制,所以本应写成 '/077',但因为C,C++规定不允许使用斜杠加10进制数来表示字符,所以这里的0可以不写。

  事实上我们很少在实际编程中非要用转义符加八进制数来表示一个字符,所以,6.2.4小节的内容,大家仅仅了解就行。

  6.2.5 十六进制数转换成十进制数

  2进制,用两个阿拉伯数字:0、1;

  8进制,用八个阿拉伯数字:0、1、2、3、4、5、6、7;

  10进制,用十个阿拉伯数字:0到9;

  16进制,用十六个阿拉伯数字……等等,阿拉伯人或说是印度人,只发明了10个数字啊?

  16进制就是逢16进1,但我们只有0~9这十个数字,所以我们用A,B,C,D,E,F这五个字母来分别表示10,11,12,13,14,15。字母不区分大小写。

  十六进制数的第0位的权值为16的0次方,第1位的权值为16的1次方,第2位的权值为16的2次方……

  所以,在第N(N从0开始)位上,如果是是数 X (X 大于等于0,并且X小于等于 15,即:F)表示的大小为 X * 16的N次方。

  假设有一个十六进数 2AF5, 那么如何换算成10进制呢?

  用竖式计算:

  2AF5换算成10进制:

  第0位: 5 * 16^0 = 5

  第1位: F * 16^1 = 240

  第2位: A * 16^2 = 2560

  第3位: 2 * 16^3 = 8192

  ---------------------------------

  10997

  直接计算就是:

  5 * 16^0 + F * 16^1 + A * 16^2 + 2 * 16^3 = 10997

  (别忘了,在上面的计算中,A表示10,而F表示15)

  现在可以看出,所有进制换算成10进制,关键在于各自的权值不同。

  假设有人问你,十进数 1234 为什么是 一千二百三十四?你尽可以给他这么一个算式:

  1234 = 1 * 10^3 + 2 * 10^2 + 3 * 10^1 + 4 * 10^0

  6.2.6 十六进制数的表达方法

  如果不使用特殊的书写形式,16进制数也会和10进制相混。随便一个数:9876,就看不出它是16进制或10进制。

  C,C++规定,16进制数必须以 0x开头。比如 0x1表示一个16进制数。而1则表示一个十进制。另外如:0xff,0xFF,0X102A,等等。其中的x也也不区分大小写。(注意:0x中的0是数字0,而不是字母O)

  以下是一些用法示例:

  int a = 0x100F;

  int b = 0x70 + a;

  至此,我们学完了所有进制:10进制,8进制,16进制数的表达方式。最后一点很重要,C/C++中,10进制数有正负之分,比如12表示正12,而-12表示负12,;但8进制和16进制只能用达无符号的正整数,如果你在代码中里:-078,或者写:-0xF2,C,C++并不把它当成一个负数。

  6.2.7 十六进制数在转义符中的使用

  转义符也可以接一个16进制数来表示一个字符。如在6.2.4小节中说的 '?' 字符,可以有以下表达方式:

  '?' //直接输入字符

  '/77' //用八进制,此时可以省略开头的0

  '/0x3F' //用十六进制

  同样,这一小节只用于了解。除了空字符用八进制数 '/0' 表示以外,我们很少用后两种方法表示一个字符。

  6.3 十进制数转换到二、八、十六进制数

  6.3.1 10进制数转换为2进制数

  给你一个十进制,比如:6,如果将它转换成二进制数呢?

  10进制数转换成二进制数,这是一个连续除2的过程:

  把要转换的数,除以2,得到商和余数,

  将商继续除以2,直到商为0。最后将所有余数倒序排列,得到数就是转换结果。

  听起来有些糊涂?我们结合例子来说明。比如要转换6为二进制数。

  “把要转换的数,除以2,得到商和余数”。

  那么:

  要转换的数是6, 6 ÷ 2,得到商是3,余数是0。 (不要告诉我你不会计算6÷3!)

  “将商继续除以2,直到商为0……”

  现在商是3,还不是0,所以继续除以2。

  那就: 3 ÷ 2, 得到商是1,余数是1。

  “将商继续除以2,直到商为0……”

  现在商是1,还不是0,所以继续除以2。

  那就: 1 ÷ 2, 得到商是0,余数是1 (拿笔纸算一下,1÷2是不是商0余1!)

  “将商继续除以2,直到商为0……最后将所有余数倒序排列”

  好极!现在商已经是0。

  我们三次计算依次得到余数分别是:0、1、1,将所有余数倒序排列,那就是:110了!

  6转换成二进制,结果是110。

  把上面的一段改成用表格来表示,则为:

  被除数 计算过程 商 余数

  6 6/2 3 0

  3 3/2 1 1

  1 1/2 0 1

  (在计算机中,÷用 / 来表示)

  如果是在考试时,我们要画这样表还是有点费时间,所更常见的换算过程是使用下图的连除:

  (图:1)

  请大家对照图,表,及文字说明,并且自已拿笔计算一遍如何将6转换为二进制数。

  说了半天,我们的转换结果对吗?二进制数110是6吗?你已经学会如何将二进制数转换成10进制数了,所以请现在就计算一下110换成10进制是否就是6。

  6.3.2 10进制数转换为8、16进制数

  非常开心,10进制数转换成8进制的方法,和转换为2进制的方法类似,惟一变化:除数由2变成8。

  来看一个例子,如何将十进制数120转换成八进制数。

  用表格表示:

  被除数 计算过程 商 余数

  120 120/8 15 0

  15 15/8 1 7

  1 1/8 0 1

  120转换为8进制,结果为:170。

  非常非常开心,10进制数转换成16进制的方法,和转换为2进制的方法类似,惟一变化:除数由2变成16。

  同样是120,转换成16进制则为:

  被除数 计算过程 商 余数

  120 120/16 7 8

  7 7/16 0 7

  120转换为16进制,结果为:78。

  请拿笔纸,采用(图:1)的形式,演算上面两个表的过程。

  6.4 二、十六进制数互相转换

  二进制和十六进制的互相转换比较重要。不过这二者的转换却不用计算,每个C,C++程序员都能做到看见二进制数,直接就能转换为十六进制数,反之亦然。

  我们也一样,只要学完这一小节,就能做到。

  首先我们来看一个二进制数:1111,它是多少呢?

  你可能还要这样计算:1 * 20 + 1 * 21 + 1 * 22 + 1 * 23 = 1 * 1 + 1 * 2 + 1 * 4 + 1 * 8 = 15。

  然而,由于1111才4位,所以我们必须直接记住它每一位的权值,并且是从高位往低位记,:8、4、2、1。即,最高位的权值为23 = 8,然后依次是 22 = 4,21=2, 20 = 1。

  记住8421,对于任意一个4位的二进制数,我们都可以很快算出它对应的10进制值。

  下面列出四位二进制数 xxxx 所有可能的值(中间略过部分)

  仅4位的2进制数 快速计算方法 十进制值 十六进值

  1111 = 8 + 4 + 2 + 1 = 15 F

  1110 = 8 + 4 + 2 + 0 = 14 E

  1101 = 8 + 4 + 0 + 1 = 13 D

  1100 = 8 + 4 + 0 + 0 = 12 C

  1011 = 8 + 4 + 0 + 1 = 11 B

  1010 = 8 + 0 + 2 + 0 = 10 A

  1001 = 8 + 0 + 0 + 1 = 10 9

  ....

  0001 = 0 + 0 + 0 + 1 = 1 1

  0000 = 0 + 0 + 0 + 0 = 0 0

  二进制数要转换为十六进制,就是以4位一段,分别转换为十六进制。

  如(上行为二制数,下面为对应的十六进制):

  1111 1101 , 1010 0101 , 1001 1011

  F D , A 5 , 9 B

  反过来,当我们看到 FD时,如何迅速将它转换为二进制数呢?

  先转换F:

  看到F,我们需知道它是15(可能你还不熟悉A~F这五个数),然后15如何用8421凑呢?应该是8 + 4 + 2 + 1,所以四位全为1 :1111。

  接着转换 D:

  看到D,知道它是13,13如何用8421凑呢?应该是:8 + 4 + 1,即:1101。

  所以,FD转换为二进制数,为: 1111 1101

  由于十六进制转换成二进制相当直接,所以,我们需要将一个十进制数转换成2进制数时,也可以先转换成16进制,然后再转换成2进制。

  比如,十进制数 1234转换成二制数,如果要一直除以2,直接得到2进制数,需要计算较多次数。所以我们可以先除以16,得到16进制数:

  被除数 计算过程 商 余数

  1234 1234/16 77 2

  77 77/16 4 13 (D)

  4 4/16 0 4

  结果16进制为: 0x4D2

  然后我们可直接写出0x4D2的二进制形式: 0100 1101 0010。

  其中对映关系为:

  0100 -- 4

  1101 -- D

  0010 -- 2

  同样,如果一个二进制数很长,我们需要将它转换成10进制数时,除了前面学过的方法是,我们还可以先将这个二进制转换成16进制,然后再转换为10进制。

  下面举例一个int类型的二进制数:

  01101101 11100101 10101111 00011011

  我们按四位一组转换为16进制: 6D E5 AF 1B

  在PASCAL中的编程:

  var a:integer;

  begin

  write('Input a number:');

  readln(a);

  if a>255 then writeln('Bu zai fan wei');

  if a<=255 then writeln(chr(a));

  readln;

  end.

<think>好的,我现在需要回答用户关于ASCII编码及其应用的提问。首先,我得先回忆一下自己了解的ASCII相关知识,然后结合提供的引用内容,确保信息的准确性。用户给出的引用有五个,我需要正确引用它们来支持回答。 首先,ASCII编码的基本概念。根据引用[3],ASCII是单字节编码,主要用于英文西欧语言,使用\x80以下的128个字符。这一点很重要,需要明确说明ASCII的范围设计目的。 接下来,编码方式。引用[1]提到ASCII_Encoded(C) = Binary(ASCII(C)),也就是将字符转换为对应的二进制数。需要解释每个字符对应一个7位二进制数,存储为一个字节,最高位通常为0。例如,大写字母A是65,对应二进制01000001。 然后,编码结构。根据引用[4],ASCII分为控制字符(0-31)可显示字符(32-127)。控制字符如换行、回车等,而可显示字符包括数字、字母符号。这里可以举例说明,比如空格是32,'0'是48,'A'是65,'a'是97,这样用户更清楚。 应用方面,用户可能想知道ASCII在哪些地方使用。引用[2][5]提到在Python中使用ASCII编码的情况,比如纯英文可以用ASCII,而中文不行,会报错。这说明ASCII在编程中的基础作用,尤其是在处理文本编码时的重要性。此外,引用[3]提到MBCS的基础是ASCII,这可能涉及到扩展编码的历史背景,比如其他编码如何利用ASCII的保留位进行扩展。 现在要考虑用户可能的疑问点,比如为什么ASCII只有128个字符,或者与其他编码的区别。比如,UnicodeUTF-8的出现是为了解决多语言问题,而ASCII作为基础,仍有其不可替代的地位。 另外,用户提到相关问题,需要生成相关的问题。比如ASCII的局限性,与其他编码的关系,如何在不同编程语言中使用,或者在数据传输中的应用。这些问题可以帮助用户更深入理解主题。 需要注意引用标注的正确位置,确保每个引用的信息准确对应。例如,在讨论Python中的编码问题时,引用[2][5]支持说明ASCII的局限性,而引用[3][4]用于解释ASCII本身的结构。 最后,结构要清晰,分点介绍,每个部分简明扼要。避免技术术语过于复杂,用易懂的语言解释概念。同时,确保示例正确,比如Python代码中的错误情况,符合引用中的描述。</think>### ASCII编码介绍及使用 #### 1. ASCII编码的定义与背景 ASCII(American Standard Code for Information Interchange)是一种单字节字符编码标准,最初设计用于表示英语及控制字符[^3]。它基于拉丁字母,包含128个字符(0-127),使用7位二进制数表示,存储时占用一个字节(最高位通常为0)[^4]。例如: - 字符 `A` 的ASCII为 $65$,对应二进制 $01000001$ - 控制字符如换行符(`\n`)的ASCII为 $10$。 #### 2. 编码结构 ASCII分为两部分: 1. **控制字符(0-31)**:用于设备控制(如换行、退格)。 2. **可显示字符(32-127)**:包括数字、大小写字母、标点符号等。 - 数字 `0` 对应 $48$,字母 `a` 对应 $97$[^4]。 #### 3. ASCII的应用场景 - **文本存储与传输**:纯英文文本默认使用ASCII编码,例如配置文件、日志文件[^2]。 - **编程语言基础**:在Python中,若未指定编码,默认使用ASCII处理字符串,但中文字符需用UTF-8编码[^5]。 - **编码扩展的基础**:MBCS(多字节字符集)利用ASCII未使用的最高位扩展其他语言字符[^3]。 #### 4. 局限性 - **仅支持拉丁字符**:无法表示中文、日文等非西欧语言[^2]。 - **范围限制**:仅覆盖7位二进制,无法满足复杂需求(如数学符号、表情符号)。 #### 示例:Python中的ASCII编码问题 ```python # 纯英文可编码为ASCII s = "hello" print(s.encode("ascii")) # 输出:b'hello' # 含中文会报错 s = "你好" print(s.encode("ascii")) # 报错:UnicodeEncodeError ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值