1.1.1 数组概述
在程序设计中,为了处理方便,把具有相同类型的若干变量按有序的形式组织起来,这些按序排列的同类数据元素的集合称为数组。在C语言中,数组属于构造数据类型。一个数组可以分解为多个数组元素,这些数组元素可以是基本数据类型或是构造类型。C语言数组按维数分有一维、二维和多维,按数组元素的类型又可分为数值数组、字符数组、指针数组、结构体数组等各种类别。
对数组特点概括如下:
① 数组是有序数据的集合, 用数组名标识。
② 数组元素需属同一数据类型,用数组名和下标确定。
③ 一维数组的定义:数据类型 数组名[常量表达式]。
④ 数组名表示的是内存首地址,是地址常量,所以只能右值(=号的右边),不能是左值(=号的左边,当变量使用)。
⑤ 程序运行时对数组分配连续的内存空间,数组空间大小=数组维数*sizeof(元素数据类型)。
⑥ 数组元素个数的下标从0开始。
⑦ C语言对数组不作越界检查,使用时要注意。int a[5]只能用a[0]~a[4],用a[5]就发生了越界。
⑧ 只能逐个引用数组元素,不能一次引用整个数组。
⑨ 数组不初始化时,其元素值为随机数。
⑩ 对static数组元素不赋初值时,系统会自动赋以0值。
⑪ 当全部数组元素赋初值时,可不指定数组长度。
⑫ C语言中无字符串变量,是用字符数组处理字符串,字符串结束标志为字符'\0'。
1.1.2 一维数组
1. 一维数组定义
在C语言中使用数组必须先进行定义。
一维数组的定义方式如下:
类型说明符 数组名[常量表达式];
其中:
① 类型说明符是任一种基本数据类型或构造数据类型。
② 数组名是用户定义的数组标识符。
③ 方括号中的常量表达式表示数据元素的个数,也称为数组的长度。
例如:
int a[10]; 说明整型数组a,有10个元素。
float b[10],c[20]; 说明实型数组b,有10个元素;实型数组c,有20个元素。
char ch[20]; 说明字符数组ch,有20个元素。
对于数组类型说明应注意以下几点:
① 数组的类型实际上是指数组元素的取值类型,对于同一个数组,其所有元素的数据类型都是相同的。
② 数组名的书写规则应符合标识符的书写规定。
③ 数组名不能与其他变量名相同。
④ 方括号中常量表达式表示数组元素的个数,但是其下标从0开始计算。如a[3]表示数组a有3个元素,这3个元素分别为a[0]、a[1]、a[2]。
⑤ 注意数组的越界,达到数组的最大序号就是越界。
⑥ 不能在方括号中用变量来表示元素的个数,但是可用符号常数或常量表达式。
例如:
#define FD 5
main()
{
int a[3+2],b[7+FD];
……
}
是合法的。
但是下述说明方式是错误的。
main()
{
int n=5;
int a[n];
……
}
2. 一维数组元素的引用
数组元素是组成数组的基本单元,数组元素也是一种变量,其标识方法为数组名后跟一个下标,下标表示了元素在数组中的顺序号。
数组元素引用形式如下:
数组名[下标]
其中下标只能为整型常量或整型表达式。如为小数时,C编译将自动取整。
例如:
a[5]、a[i+j]、a[i++]都是合法的数组元素。
数组元素通常也称为下标变量,必须先定义数组,才能使用下标变量。在C语言中只能逐个地使用下标变量,而不能一次引用整个数组。
例如,输出有10个元素的数组必须使用循环语句逐个输出各下标变量,输出方法如下:
for(i=0; i<10; i++)
printf("%d",a[i]);
不能用一个语句输出整个数组,下面的写法是错误的:
printf("%d",a);
3. 一维数组内存格局
【例6-1】以int a[3]和char aa[5]为例说明数组内存的格局。
表6-1列出例6-1中数组变量内存格局图,其中“==”表示左右两边变量相等,后文同。int说明数组a中每个元素类型为int,每个元素占用4个字节,下标3表示元素个数为3,此数组元素为a[0]~a[3]。a同时又是该数组的首地址,是一地址常量。
char说明数组aa中每个元素类型为char,每个元素占用1个字节,下标5表示元素个数为5,此数组元素为aa[0]~a[4]。aa同时又是该数组的首地址。
由于a和aa代表的是内存地址,编译后逻辑地址固定,所以是地址常量。且a和aa本身代表地址时本身不占内存空间,不像指针变量有专门4个字节来存放变量的内存地址,数组名为地址常量,而指针变量是地址变量。
表6-1 一维数组内存布局表
一维数组的内存格局,假设变量的堆栈起始地址为3000 | |||
内存地址 | 内 存 | 假设的内存值 | 说明 |
3000 |
a[2] |
9 | 编译完成后机器代码只认识地址,不认识变量。如a[2]=9时编译后的机器代码为向内存地址3000~2997内存里写入数据9 |
2999 | |||
2998 | |||
2997 | |||
2996 | a[1] | 6 | a[1]代表内存地址2996~2993空间的抽象,&a1为内存地址2996。由于此数组类型为int,每个元素占用4个字节,如a[1]=6编译完成后机器代码转换为对相应内存地址的操作,就是向地址为&a[1](即2996)相邻4个字节的内存里写入6 |
2995 | |||
2994 | |||
2993 | |||
2992 | a[0] | 3 | a[0]代表内存地址2992~2989内存空间的抽象,其存放的值为3,此时a[0]可以与3划上等号。&a[0]等于内存地址2992,同时数组名a也代表内存地址2992,所以a==&a[0] |
2991 | |||
2990 | |||
2989 | |||
2988 | aa[4] |
| 编译器通过元素类型确定每个元素的大小,通过元素类型和元素下标确定每个数组元素的内存地址,公式为“数组首地址+下标*单个元素长度” |
2987 | aa[3] |
| |
2986 | aa[2] |
| |
2985 | aa[1] |
| |
2984 | aa[0] |
|
4. 一维数组的初始化
给数组赋值的方法除了用赋值语句对数组元素逐个赋值外,还可采用初始化赋值和动态赋值的方法。
数组初始化赋值是指在数组定义时给数组元素赋予初值,数组初始化是在编译阶段进行的。这样将减少运行时间,提高效率。
初始化赋值的一般形式为:
类型说明符 数组名[常量表达式]={值,值……值};
其中在{ }中的各数据值即为各元素的初值,各值之间用逗号间隔。
例如:
int a[10]={ 0,1,2,3,4,5,6,7,8,9 };
相当于a[0]=0;a[1]=1...a[9]=9;
C语言对数组的初始化赋值还有以下几点规定:
(1) 可以只给部分元素赋初值。
当{ }中值的个数少于元素个数时,只给前面部分元素赋值。
例如:
int a[10]={0,1,2,3,4};
表示只给a[0]~a[4]5个元素赋值,而后5个元素自动赋0值。
(2) 只能给元素逐个赋值,不能给数组整体赋值。
例如给十个元素全部赋1值,只能写为:
int a[10]={1,1,1,1,1,1,1,1,1,1};
而不能写为:
int a[10]=1;
(3) 如给全部元素赋值,则在数组说明中,可以不给出数组元素的个数。
例如:
int a[5]={1,2,3,4,5};
可写为:
int a[]={1,2,3,4,5};
5. 一维数组应用举例
【例6-2】输入10个数,并输出最大的数。
arrmax.c源代码如下:
#include <stdio.h>
int main()
{
int i,max,a[10];
printf("input 10 numbers:\n");
for(i=0;i<10;i++)
scanf("%d",&a[i]);
max=a[0];
for(i=1;i<10;i++)
if(a[i]>max) max=a[i];
printf("maxmum=%d\n",max);
return 0 ;
}
编译 gcc arrmax.c -o arrmax。
执行 ./arrmax, 执行结果如下:
input 10 numbers:
3 9 1 900 100 800 700 600 90 0
maxmum=900
1.1.3 二维数组
1. 二维数组的定义
二维数组定义的一般形式如下:
类型说明符 数组名[常量表达式1][常量表达式2] ;
其中常量表达式1表示第一维下标的长度,常量表达式2 表示第二维下标的长度。
例如:
char a[3][4];
说明了一个三行四列的数组,数组名为a,其下标变量的类型为整型。该数组的下标变量共有3×4个,即:
a[0][0],a[0][1],a[0][2],a[0][3],
a[1][0],a[1][1],a[1][2],a[1][3],
a[2][0],a[2][1],a[2][2],a[2][3]
二维数组在概念上是二维的,即是说其下标在两个方向上变化,下标变量在数组中的位置也处于一个平面之中,而不是象一维数组只是一个向量。但是,实际的硬件存储器却是连续编址的,也就是说存储器单元是按一维线性排列的,二维数组也是线性存储在内存中。
二维数组长度计算公式如下:
二维数组长度=存储类型长度*第一维下标*第二维下标
表6-2列出了char a[3][4]的内存布局表,从表中可以看出,二维数组内存空间是连续分配的,数组名和数组的一维下标表示的都是内存地址。
表6-2 char a[3][4]的内存布局表
一维数组的内存格局,假设变量的堆栈起始地址为-2889 | ||
内存地址 | 内存 | 补充说明 |
-2889 | a[2][3] |
|
-2990 | a[2][2] |
|
-2991 | a[2][1] |
|
-2992 | a[2][0] | 此时a[2]==&a[2][0]==-2992 |
-2993 | a[1][3] |
|
-2994 | a[1][2] |
|
-2995 | a[1][1] |
|
-2996 | a[1][0] | 此时a[1]==&a[1][0]==-2996 |
-2997 | a[0][3] |
|
-2998 | a[0][2] |
|
-2999 | a[0][1] |
|
-3000 | a[0][0] | 此时a==a[0]==&a[0][0]==-3000 |
2. 二维数组的初始化
二维数组初始化也是在类型说明时给各下标变量赋以初值。二维数组可按行分段赋值,也可按行连续赋值。
例如对数组a[5][3],可用如下两种方法初始化。
① 按行分段赋值可写为:
int a[5][3]={ {80,75,92},{61,65,71},{59,63,70},{85,87,90},{76,77,85} };
② 按行连续赋值可写为:
int a[5][3]={ 80,75,92,61,65,71,59,63,70,85,87,90,76,77,85};
这两种赋初值的结果是完全相同的。
对于二维数组初始化赋值还有以下说明:
(1) 可以只对部分元素赋初值,未赋初值的元素自动取0值。
例如:int a[3][3]={{1},{2},{3}};
是对每一行的第一列元素赋值,未赋值的元素取0值。 赋值后各元素的值为:
1 0 0
2 0 0
3 0 0
int a [3][3]={{0,1},{0,0,2},{3}};
赋值后的元素值为:
0 1 0
0 0 2
3 0 0
(2) 如对全部元素赋初值,则第一维的长度可以不给出。
例如:int a[3][3]={1,2,3,4,5,6,7,8,9};
可以写为:int a[][3]={1,2,3,4,5,6,7,8,9};
(3) 数组是一种构造类型的数据,二维数组可以看作是由一维数组的嵌套而构成的,假设一维数组的每个元素都又是一个数组,就组成了二维数组。当然,前提是各元素类型必须相同。根据这样的分析,一个二维数组也可以分解为多个一维数组,C语言允许这种分解。
如二维数组a[3][4],可分解为三个一维数组,其数组名分别为a[0]、a[1]、a[2],这三个一维数组都有4个元素。例如:一维数组a[0]的元素为a[0][0]、a[0][1]、a[0][2]、a[0][3]。
必须强调的是,a[0]、a[1]、a[2]不能当做下标变量使用,它们是数组名,不是一个单纯的下标变量。但a[0]、a[1]、a[2]代表数组第二维的首地址。
3. 多维数组定义
C语言允许构造多维数组,多维数组元素有多个下标,以标识它在数组中的位置,所以也称为多下标变量。多维数组可由二维数组类推而得到。
多维数组定义语法形式如下:
类型 数组名[长度1][长度2]……[长度N];
例如:int m[9][9][8][9]占用空间为4*9*9*8*9。
4. 二维数组程序举例
【例6-3】一个学习小组有5个人,每个人有三门课的考试成绩,求全组分科的平均成绩和各科总平均成绩。表6-3列出此5个人的三门课的考试成绩。
表6-3 二维数组应用案例表
| 张 | 王 | 李 | 赵 | 周 |
Math | 80 | 61 | 59 | 85 | 76 |
C | 75 | 65 | 63 | 87 | 77 |
Java | 92 | 71 | 70 | 90 | 85 |
此时可设一个二维数组a[5][3]存放五个人三门课的成绩,再设一个一维数组v[3]存放所求得各分科平均成绩,设变量average为全组各科总平均成绩。
twoarray.c源代码如下:
#include <stdio.h>
int main()
{
int i,j,s=0,average,v[3],a[5][3];
printf("input score\n");
for(i=0;i<3;i++)
{
for(j=0;j<5;j++)
{ scanf("%d",&a[j][i]);
s=s+a[j][i];}
v[i]=s/5;
s=0;
}
average =(v[0]+v[1]+v[2])/3;
printf("math:%d\nc languag:%d\nJava:%d\n",v[0],v[1],v[2]);
printf("total:%d\n", average );
return 0 ;
}
编译 gcc twoarray.c -o twoarray。
执行 ./twoarray, 执行结果如下:
input score
80 61 59 85 76
75 65 63 87 77
92 71 70 90 85
math:72
c languag:73
Java:81
total:75
1.1.4 字符数组
1. 字符数组说明
在C语言中没有专门的字符串变量,通常用一个字符数组来存放一个字符串。前面介绍字符串常量时,已说明字符串总是以'\0'作为串的结束符。因此当把一个字符串存入一个数组时,也把结束符'\0'存入数组,并以此作为该字符串是否结束的标志。有了'\0'标志后,就不必再用字符数组的长度来判断字符串的长度了。
C语言允许用字符串的方式对数组作初始化赋值。
例如:
char c[]={'c', ' ','p','r','o','g','r','a','m'};
可写为:
char c[]={"C program"};
或去掉{}写为:
char c[]="C program";
用字符串方式赋值比用字符逐个赋值要多占一个字节,用于存放字符串结束标志'\0'。上面的后两种数组c在内存中的实际存放情况为:
C |
| p | r | o | g | r | a | m | \0 |
'\0'是由C编译系统自动加上的。由于采用了'\0'标志,所以在用字符串赋初值时一般无须指定数组的长度,而由系统自行处理。
截断字符数组或者增加结束标志方法为:c[6]= '\0'或c[6]=0。
2. 字符串处理说明
如果字符数组存放的是字符串,输入可使用scanf("%s",字符数组名),输出可使用printf("%s",字符数组名)。
字符串处理需要包含<string.h>头文件,需要使用strcpy、strlen等字符串函数,具体使用见第9章。
3. 字符数组举例
strarray.c源代码如下:
#include <stdio.h>
#include <string.h>
int main()
{
char st[15];
char st1[15] ;
printf("input string:\n");
scanf("%s",st);
printf("%s\n",st);
strcpy(st1, st) ;
printf("cmp=%d\n", strcmp(st, st1)) ;
return 0 ;
}
编译 gcc strarray.c -o strarray。
执行 ./strarray, 执行结果如下:
input string:
hello
hello
cmp=0
摘录自《深入浅出Linux工具与编程》