一、结构体介绍
在C语言中,结构体(struct)指的是一种数据结构,是C语言中聚合数据类型(aggregate data type)的一类。结构体可以被声明为变量、指针或数组等,用以实现较复杂的数据结构。结构体同时也是一些元素的集合,这些元素称为结构体的成员(member),且这些成员可以为不同的类型,成员一般用名字访问。
二、结构体的类型、定义及声明
结构体的定义如下所示,struct为结构体关键字,tag为结构体的标志,struct tag表示结构体类型member-list为结构体成员列表,其必须列出其所有成员,variable-list为此结构体声明的变量。
struct tag {
member-list
} variable-list ;
下面演示几个结构体的定义
1.匿名结构体
struct {
char name[20];
int age;
double score;
} s1;
上面定义了一个成员为char类型数组、int类型、double类型,没有标志,同时声明了结构体变量为s1的结构体,这种结构体叫做匿名结构体。
对于匿名结构体,我们有以下几点需要注意:
1.这种声明出来的结构体类型我们只能定义一次变量,即该结构体专属于s1。
2.如果存在两个匿名结构体类型的成员变量完全一样,而声明的结构体变量不同,那么这两个结构体仍然是两个完全不同的类型,出现以下代码则是非法的行为。
struct {
char name[20];
int age;
double score;
} s1;
struct {
char name[20];
int age;
double score;
} a[20], *p;
int main()
{
p = &s1;//非法行为,这两个结构体被看作是完全不同的类型
return 0;
}
2.重定义结构体类型名
有时候我们为了让代码可读性更强,会将结构体的标志写的更完整些,但这对我们后面对结构体的调用显得不是那么的简明,所以我们在这里可以使用typedef来对结构体类型名重定义。
typedef struct student{
char name[20];
int age;
double score;
} stu;
注意此时stu并不是声明的结构体变量,而是重定义的一个标签,这样我们以后可以用结构体类型名struct stu来代替struct student,来创建结构体变量。
3.结构体的自引用
产生自引用的想法,是我们想让结构体中的变量通过结构体,找到下一个结构体中的变量,他们就像一个链条一样环环相扣。
我们尝试写出以下代码:
struct Node
{
int data;
struct Node next;
};
在这种情况下,我们通过自引用,仿佛实现了我们的想法,但是用sizeof计算该结构体大小的时候,编译器会报出如下错误:
每个结构体套用一个自身,这种思想我们在函数递归操作中也是用过,而且我们对于结构体的这种调用,是没有限制的,理论上可以套无数个该类型的结构体。
正确的方法我们应该用一个指针,用指向地址的方式,来帮助这一个结构体变量来寻找下一个结构体变量。我们知道指针的类型根据使用平台的不同,是4/8个字节,那么一个结构体类型的大小我们就可以确定了。
struct Node
{
int data;
struct Node* next;
};
三、结构体的初始化
对于结构体的初始化,我们可以在创建时就对他声明,如
struct student{
char name[20];
int age;
double score;
} s1={"zhangsan",34,89.33};
也可以在使用前初始化
typedef struct student{
char name[20];
int age;
double score;
} stu;
int main()
{
struct stu S={"zhangsan",34,89.33};
//...
return 0;
}
四、结构体的内存对齐
我们先来看一组例子
struct S1
{
char a;
int b;
char c;
};
struct S2
{
char a;
char b;
int c;
};
int main()
{
printf("%d %d\n", sizeof(struct S1),sizeof(struct S2));
return 0;
}
运行的结果是
12 8
明明拥有同样的成员,为什么用sizeof计算出的内存大小却不一样?
这是因为,结构体在内存中的对齐满足以下规则:
1.结构体中的第一个成员在与结构体变量偏移量为0的地址处。
2.其它成员变量要对齐到一个名叫对齐数的整数倍的地址处。对齐数=编译器默认的一个对齐数与该结构体中的成员变量大小中的较小值。在vs2022,默认对齐数为8。
3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍.
4.如果存在了嵌套结构体的情况,嵌套的结构体则对齐到自己的成员变量中最大对齐数的整数倍处,包含该嵌套结构体的结构体大小为其成员变量(包含嵌套结构体)最大对齐数的整数倍。
我们通过画图来更详细的讲解一下上述示例
对于结构体S1:
对于结构体S2:
在计算内存偏移的时候,我们可以引入offsetof函数来帮助我们验证结构,使用offsetof前,应包含<stddef.h>头文件。
struct S1
{
char a;
int b;
char c;
};
int main()
{
printf("%d\n", offsetof(struct S1, a));
printf("%d\n", offsetof(struct S1, b));
printf("%d\n", offsetof(struct S1, c));
return 0;
}
运行结果是:
0
4
8
为什么要设置规则,让结构体在内存中有对齐这种说法呢,这是因为:
1.不是所有的硬件平台都能够访问任意地址处的任意数据的,某些硬件平台只能在某些地址处取特定类型的数据,否则就会抛出硬件异常。
2.数据结构(尤其是栈)因该尽可能的在自然边界上对齐。为了访问未对齐的数据,处理器需要做两次内存访问,而对齐的内存只需要一次访问就够了。
简单来说,结构体的内存对齐就是一种用空间换取时间的做法,浪费空间来换取性能上的提升。那在设计结构体的时候,我们既要满足对齐,又要节省空间,让占用空间小的成员尽量集中到一起,这就可以降低一些空间的浪费了。
以上就是对结构体类型,结构体的创建和初始化,结构中存在的内存对齐的讲解,希望对您的学习有所帮助。