一、开始
今天有一个困扰的问题,就是char与signed char, unsigned char这三者的区别。
二、三者之间
1.ANSI C 提供了3种字符类型,分别是char、signed char、unsigned char。而不是像short、int一样只有两种(int默认就是unsigned int).
2.三者都占1个字节
3.signed char取值范围是 -128 到 127(有符号位) unsigned char 取值范围是 0 到 255
4.内存中一串二进制,它的含义,就是这个类型来说明的。
5.所谓signed char 和 unsigned char 其实是相对“运算”而说的,已经脱离了我们字面含义“字符”,表示的范围有限。
三、char
1.char的定义
C标准中对char是 Impementation Defined,就是未明确定义
(1)那它由什么定义?坦白说,具体的编译器明确定义,一般都是用signed char或unsigned char来实现char的,也就是说不同的编译器对char是什么定义不一样
(2)为什么要这样定义?因为这三种类型的对象在存储介质中的表现形式是一样的(都是一个占8bit的01串,只是解析的时候不同)
(3)到底是signed char还是unsigned char?这得看编译器:VC编译器、x86上的GCC都把char定义为signed char,而arm-linux-gcc却把char定义为 unsigned char
2.char的使用
char的不同使用给了它不同的字面上的含义
(1)当字符用
原始的ASCII标准里,定义的字符码值是只有0~127,所以怎么定义的char都刚好好装得下,于是普通意义上我们对它的理解就是它表示一个字符,也就是让表示一个ASCII码(这也是C语言基础中对它的解释)
(2)当单字节整数
从本质上来说,字符('a', 'b', 'c'等)本质上也是一个整数,只是字符代表的值是0~127,我们可以用char表示一个不太大的整数
四、坑
在Linux系统中,文件结束符EOF被定义为-1,如果用fgetc读取文件,该函数返回值c定义为int,但有时候我们可能把返回值作为char处理,于是很容易写作if ((char)c == EOF)来判断读结束,但是,在arm gcc里,char默认是unsigned char,因此(char)c实际上是(unsigned char)c,也就是当c=-1时,成了if (255 == EOF),由于EOF默认为int不会自动转为255,所以这个条件总是不成立。