编程语言的核心就是它的数据类型和运算符。这些元素定义了语言的极限和语言可以完成的功能。正如我们所期望的那样,C++支持大量的数据类型和运算符,这使得它在很多领域都是很合适的编程语言。数据类型和运算符的内容很丰富。这里,我们将以C++中最基本的数据类型和最常用的运算符开始学习。我们还会进一步研究变量和表达式。
为什么数据类型如此重要
数据类型如此重要是因为它决定了可以使用的运算符和可以存储的数值的范围。C++中定义了几种数据类型,每种都有各自的特点。由于数据类型不一样,所有的变量在使用之前都必须进行声明。变量的声明包括指定变量的类型。编译器需要这个信息来生成正确的代码。在C++中没有所谓的“没有类型”的变量。
数据类型如此重要的第二个原因是因为这几种基本的类型是和计算机操作的基本对象紧密相关的:字节和字。因此C++允许我们操作的数据类型是和CPU直接操作的类型一样的。这也是为什么C++能够编写出高效的、系统级的代码的原因之一。
基本技能 2.1: C++中的数据类型
C++提供的内置数据类型是对应于整型,字符,浮点和布尔类型的值。这也是程序中通常存储和处理数据的方式。在本书后面的章节中会看到,C++允许我们构建更复杂的类型,比如类,结构,枚举,但是它们完全是由内置的类型所构成。
C++类型系统的核心就是下面的7种基本的数据类型
类型 |
意义 |
char |
Character 字符 |
wchar_t |
Wide Character 宽位字符 |
int |
Integer 整型数 |
float |
Floating Point 单精度浮点数 |
double |
Double Floating Point 双精度浮点数 |
bool |
Boolean 布尔类型 |
void |
Valueless 空类型 |
C++允许一些基本数据类型可以被修饰符修饰,修饰符放置在类型的前面。修饰符改变了基本类型的含义,使得它能满足不同的需要。数据类型的修饰符如下:
signed
unsigend
long
short
修饰符signed、unsigned、long、short都可以用于修饰int。修饰符signed和unsigned可以用来修饰char类型。类型double可以被修饰符long来修饰。表格2-1显示了所有有效的基本类型和修饰符的组合。这张表同时还给出了ANSI/ISO C++中定义的每种类型的最小取值范围。
类型 |
最小取值范围 |
char |
-127到127 |
unsigned char |
0到255 |
signed char |
-127到127 |
int |
-32767到32767 |
unsigned int |
0到65535 |
signed int |
和int的一样 |
short int |
-32767到32767 |
unsigned short int |
0到65535 |
signed short int |
和short int 的一样 |
long int |
-2147483647 到2147483647 |
signed long int |
和long int 的一样 |
unsigned long int |
0到4294967295 |
float |
1E-37到1E+37 6位精度 |
double |
1E-37到1E+37 10位精度 |
long double |
1E-37 到1E+37 10位精度 |
表格2-1 ANSI/ISO C++标准中定义的所有数字的数据类型和它们的最小取值范围
注意上表中的最小取值范围仅仅是最小的取值范围。C++编译器是允许对这些最小的取值范围进行扩展的,事实上大部分编译器都进行了扩展。因此C++数据类型的取值范围是和实现相关的。比如,在使用二进制补码的计算机上(几乎所有的计算机都是使用二进制补码的),一个整型数的取值范围至少是 -32768到32767。但是无论在什么环境下,short int的取值范围都是int类型的子域,而int 类型的取值是long int的子域。针对float,double和long double也是一样的。这里子域的意思是说范围小于或者相等。因此,int
和long int 是可以有相同的取值范围的,但是int类型的取值范围不能大于long int 类型的。
既然C++明确的只是数据类型必须支持的最小范围,我们应该阅读自己使用的编译器的文档,以便明确实际支持的范围是多少。例如,表格2-2显示了在32位环境下C++中数据类型的典型位宽,windows XP就是这样的环境。让我们了仔细看看吧。
类型 |
位宽 |
典型的取值范围 |
char |
8 |
-128到127 |
unsigned char |
8 |
0到255 |
signed char |
8 |
-128到127 |
int |
32 |
-2147483648 到 2147483647 |
unsigned int |
32 |
0 到 4294967295 |
signed int |
32 |
-2147483648 到 2147483647 |
short int |
16 |
-32768到32767 |
unsigned short int |
16 |
0到65535 |
signed short int |
16 |
-32768到32767 |
long int |
32 |
和int的一样 |
signed long int |
32 |
和singned int 一样 |
unsigned long int |
32 |
和unsigned int一样 |
float |
32 |
1.8E-38 到3.4E+38 |
double |
32 |
2.2E-308到1.8E+308 |
long double |
64 |
2.2E-308 到1.8E+308 |
bool |
N/A |
true或者false |
wchat_t |
16 |
0 到65535 |
|
|
|
整型数
正如我们在第一篇中所学习到的那样,int类型的变量存储的是不需要小数部分的整型数。这种类型的变量通常被用来做for循环的控制变量以及用于条件语句中,还有就是用来计数。因为其中不含有小数部分,因此整型数的运算要比浮点数的运算快很多。
因为整型数对于编程来说非常重要,所以C++中定义了多种类型的整型类型。就像在表格2-1中的那样,有短整型,正规的整型和长整型三种类型。更重要的是每种类型都有有符号和无符号之分。有符号的整型可以存储正数和负数。缺省情况下,整型数都是有符号的。因此在int 前面加上 signed 通常是多余的,但是这种写法是合法的。无符号的整型数只能存储正数。在需要创建无符号的整型数的时候,就需要使用unsigned修饰符。
有符号和无符号整型数的区别在于整型数的最高位的解释是不一样的。针对有符号的整型数编译器生成的代码会把最高位解释成整型数的符号位。如果这个符号位是0,则表示这个数是一个正数;如果为1,则表示这个数是个负数。负数通常总是采用补码的方式来表示。在这种表示方法中,数据的所有比特位(不包含符号位)都是取反的结果,然后加上1的结果。最后,符号位被置为1。
有符号的整数对于许多的算法来说是很重要的,但是它的取值范围只能是无符号整数取值范围的一半。例如,假设是16位的整型数 32767:
0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
对于有符号的整型数来说,如果最高位被设置为1,则这个数被解释为-1(采用二进制的补码方式)。然而,如果我们把它声明为无符号的整型数,那么当最高位被设为1的时候,它的值将为65535。
为了理解C++中有符号和无符号的区别,可以看看下面的程序:
#include <iostream>
/* 这个程序演示了无符号和有符号类型数据的差别 */
using namespace std;
int main ()
{
short int i; //一个有符号的短整型变量
unsigned short int j; //一个无符号的短整型变量
j = 60000; //60000是在无符号的整型变量的表示范围内的。
i = j; //60000超出了有符号的短整型的表示范围。
//因此,当把他赋值给i的时候,它被解释成一个负数了。
cout << i << " " <<j;
return 0;
}
上面这个程序的输出如下:
-5536 60000
由于作为一个短的无符号的整型数60000被解释成短的有符号的整型数后为-5536,因此会出现上面的结果。
C++允许在声明unsigned ,short或者long 整型数的时候采用简写。我们可以仅使用unsigned,short, or long 这几个字,而不用谢int。int关键字是暗含的。例如,下面的两条语句都声明了无符号的整型变量:
unsigned x;
unsigned int y;
字符类型
char类型的变量可以保存8位的ASCII码的字符,如A,z或者G,或者任意其它的8位的量。在明确指定字符的时候,需要用单引号把字符扩起来。例如给变量ch赋值为X的语句如下:
char ch;
ch = 'X';
我们可以使用cout语句来输出一个char类型变量的值。例如,下面的代码输出变量ch的值:
cout << "This is ch : " << ch;
输出的结果为:
This is ch : X
char类型可以被signed 或者unsigned来修饰。从技术上来讲,不管char类型是有符号的还是无符号的,缺省情况下,这都是由编译器的实现而决定的。然而,对于大多数编译器来说,char类型都是有符号的。在这种情况下,char前面用signed来修饰就显得有些冗余。就本书来讲,我们假定char类型是有符号的。
char类型的变量除了可以用来存储ASCII码的字符集外,还可以用来存储别的值。它还可以被用作表示小范围-128到127之间的整数。当程序中不需要比较大的整数的时候,可用char类型来代替int类型。例如,下面的程序使用char类型的变量来控制循环,在屏幕上输出字母表。
// This program displays the alphabet
// 这个程序用来显示字母表
#include <iostream>
using namespace std;
int main()
{
char letter;
//使用一个char类型的变量来控制for循环
for ( letter = 'A'; letter <='Z'; letter++ )
{
cout << letter ;
}
return 0;
}
上面程序中的for循环之所以能够正确的工作是因为在计算机中字母A使用65这个值来表示的,从字母A到字母Z,数值是一次递增的。因此letter的初始化值为'A',每循环一次,letter增加一。因此在第一次循环后,字母就变成了 'B'。wchar_t类型存储的字符集是大字符集的一部分。众所周知,许多人类的语言,例如中文都定义了大字符集,超出了8bit的char的表示范围。C++中增加了wchar_t类型就是为了适应这种情况。然而,在本书中,我们将不使用wchar_t类型。如果针对国际化的程序进行裁剪的时候就需要用到wchar_t类型了。
练习
1. 七种基本的类型是哪些 ?
2. 有符号和无符号数据之间的区别是什么?
3. 一个char类型的变量可以用来表示比较小的整型数吗?
答案
1. 七种基本的类型是:char, wchar_t, int, flot, double, bool和void。
2. 一个有符号的整型数可以存储正数和负数。一个无符号的整型数只能存储正数。
3. 是的。
专家答疑
问:
为什么C++中只是定义了内置类型的最小取值范围,而不是明确规定这些范围了?
答:
C++中没有明确规定内置类型的最小取值范围,可以使得各种编译器针对执行环境进行数据类型的优化。这也是C++为什么能够创建高性能的软件的部分原因。ANSI/ISO 制定的C++标准中只是简单描述了内置类型必须满足一定的要求。例如,int的范围大小可以根据代码的执行环境的要求不同而不同。因此,在32为环境下,一个int类型就是32比特。在16位的环境下,一个int类型将是16比特的宽度。这时没有必要要求16位编译器实现32为的int表示范围,这样做也会降低性能的。当然,C++标准中确实指定了所有环境下都可用的内置类型的最小范围。因此,如果我们编写的程序中的数据都没有超出这些最小的表示范围,那么我们的程序是可以移植到其它环境下的。最后一点:每个C++编译器都是在<climits>头文件中明确基本类型的表示范围的。
浮点类型
在程序中需要表示小数的时候或者需要表示非常大或者非常小的数值的时候可以使用float和double类型。float和double类型的区别在于各自表示的最大和最小数值的尺度各不相同。一个double类型可以存储的数值大概比flot类型要大10倍。两者中,double是最常用的。其中的一个原因是因为C++函数库中的大部分数学函数都是用double类型。例如sqrt()函数就返回一个double的值:入参的平方根。下面的程序根据输入的直角三角形的两直角边的长度来计算斜边长度,其中就用到了sqrt()函数:
/*
use the pythagorean theorem to find
the length of the hypotenuse given
the lengths of the two opposing sides
使用勾股定理根据直角三角形的两直角边的长度
计算斜边的长度
*/
#include <iostream>
#include <cmath> //sqrt()函数需要改头文件
using namespace std;
int main()
{
double x,y,z;
x = 5.0;
y = 4.0;
z = sqrt( x * x + y * y ); // sqrt()函数是C++书序库函数中的一个
cout << "Hypotenuse is " << z;
return 0;
}
程序的输出为:Hypotenuse is 6.40312
需要说明的另外一点:因为sqrt()函数是C++标准函数库中的,它需要标准头文件<cmath>,程序中包含了该头文件。
long double类型可以表示更大或者更小的数值。它在科学计算程序中使用的比较多。例如,在分析天文学数据的时候可能就非常有用了。
布尔类型
布尔类型是近期才增加到C++中的。它用来存储布尔值,也就是true或者false。C++中定义了两个布尔类型的常量,true和false,布尔类型只能取这两种值。在继续学习之前,我们需要知道C++中是如何定义true和false的,这点很重要。C++中的一个基本的概念就是非零的值被解释为true,零被解释为false。这种概念完全和布尔类型是一致的,因为在布尔表达式中,C++自动地把非零值转换为true,零值转换为false。反之亦然,在非布尔表达式中,true被解释为1,false被解释为0。这种零、非零与布尔值之间的转换关系是非常重要的,特别是在控制语句中,这点我们在第三篇中会看到。下面的程序展示了布尔类型的用法:
// Demonstrate bool values.
// 展示布尔值的用法
#include <iostream>
using namespace std;
int main()
{
bool b;
b = false;
cout << "b is " << b << '\n';
b = true;
cout << "b is " << b << '\n';
//布尔值可以用户if语句中的控制
if ( b ) cout << "This is executed.\n";
b = false;
if ( b ) cout << "This is not executed.\n";
//输出关系运算符的结果是true或者是false
cout << "10 > 9 is " << ( 10 > 9 ) << '\n';
return 0;
}
上面这段程序的输出如下:
b is 0
b is 1
This is executed.
10 > 9 is 1
这个程序中有三点有趣的现象需要注意。第一,正如我们所看到的,当使用cout输出布尔值的时候,输出的结果是0或者1。在本书的后面还会看到,有一个输出选择可以使得输出结果为"false"或者"true"。第二,在if语句中,可用布尔值来进行控制,没有必要使用诸如下面的代码:
if ( b == true ) ...
第三,关系运算符的输出结果,例如< 的结果,是布尔值。这也是为什么表达式10>9输出的值为1。更进一步,10>9需要用括号括起来,这个是非常必要的,因为<<运算符的优先级别高于>运算符。
void类型
void类型用来表示“无类型”的表达式。这一点看起来似乎很奇怪。我们将在本书的后面讨论如何使用void类型。
练习
1. float和double类型的主要区别是什么?
2. 布尔变量可以取什么值?0值会被转换成什么样的布尔值?
3. 什么是void类型
答案
1. float 和double类型的主要区别在于它们存储数值尺度不同。
2. 布尔类型变量的取值或是true或者false。0值转换成布尔为false。
3. void代表的是“无类型”。