自定义类型：结构体，枚举，联合

最新推荐文章于 2025-05-24 11:48:23 发布

质点994

最新推荐文章于 2025-05-24 11:48:23 发布

阅读量90

点赞数

文章标签： c语言

本文链接：https://blog.youkuaiyun.com/qq_62800805/article/details/131738364

版权

本篇博客将介绍C语言中的自定义类型，包括结构体、枚举和联合。结构体（struct）是一种用于组合不同类型的数据成员的复合数据类型，可以方便地组织和管理相关数据。枚举（enum）用于定义一组带有预定义值的常量，可以提高代码的可读性和可维护性。联合（union）是一种特殊的数据类型，允许不同类型的成员共享同一块内存空间，节省内存并提供灵活性。

我们可以使用 #define 定义常量，为什么非要使用枚举？

三、联合（共用体）

1 .联合类型的定义

2.联合大小的计算

一、结构体

1、结构体类型的声明

在C语言中，可通过使用struct关键字声明一个结构体类型。结构体类型的声明包括结构体的名称和其成员变量的定义。

struct tag {

member-list;

}variable-list;

例如描述一个学生：

struct Stu
{
 char name[20];//名字
 int age;//年龄
 char sex[5];//性别
 char id[20];//学号
}; //分号不能丢

在声明结构的时候，可以不完全的声明。比如：

//匿名结构体类型
struct
{
 int a;
 char b;
 float c;
}x;
struct
{
 int a;
 char b;
 float c;
}a[20], *p;

上面的两个结构在声明的时候省略掉了结构体标签（tag）。

问题:在上面代码的基础上，下面的代码合法吗？

p = &x;

警告： 编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。

2、结构的自引用

结构的自引用指的是在结构体内部使用结构体类型本身作为成员变量的类型。这种用法常用于链表、树等数据结构的定义。例如：

struct Node {
    int data;
    struct Node* next;
};

3、结构体变量的定义和初始化

结构体变量的定义和初始化与普通变量类似，可以在声明时定义和初始化，也可以在后续代码中进行定义和初始化。例如：

struct Point
{
 int x;
 int y;
}p1; //声明类型的同时定义变量p1
struct Point p2; //定义结构体变量p2

//初始化：定义变量的同时赋初值。
struct Point p3 = {x, y};
struct Stu        //类型声明
{
 char name[15];//名字
 int age;      //年龄
};
struct Stu s = {"zhangsan", 20};//初始化

struct Node
{
 int data;
 struct Point p;
 struct Node* next;
}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

4、结构体内存对齐

结构体的内存对齐是为了优化内存访问的效率。在结构体中，成员变量的存储是按照其自然对齐方式进行的，即成员变量的偏移量必须是它本身大小的整数倍。如果结构体中存在不符合对齐规则的成员变量，编译器会在成员之间插入填充字节来满足对齐要求。

计算以下结构体字节大小

struct S3 {
    double d; // 8字节对齐
    char c;    // 1字节对齐
    int i;     // 4字节对齐
};

struct S4 {
    char c1;        // 1字节对齐
    struct S3 s3;   // 嵌套结构体，按照结构体`S3`的对齐方式进行对齐
    double d;       // 8字节对齐
};

结构体的对齐规则：

1. 第一个成员在与结构体变量偏移量为0的地址处。

2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。

对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。

VS中默认的值为8 Linux中没有默认对齐数，对齐数就是成员自身的大小

3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。

4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

为什么存在内存对齐? 大部分的参考资料都是如是说的： 1. 平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。 2. 性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。总体来说：结构体的内存对齐是拿空间来换取时间的做法。

在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到?

让占用空间小的成员尽量集中在一起。

int main() {
	struct S1

	{
		char c1; int i; char c2;
	};

	struct S2

	{
		char c1; char c2; int i;
	};

	printf("%d\n", sizeof(struct S1));

	
	printf("%d\n", sizeof(struct S2));

S1和S2类型的成员一模一样，但是S1和S2所占空间的大小有了一些区别。

修改默认对齐数 之前我们见过了 #pragma 这个预处理指令，这里我们再次使用，可以改变我们的默认对齐数。

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
    //输出的结果是什么？
    printf("%d\n", sizeof(struct S1));
    printf("%d\n", sizeof(struct S2));
    return 0;
}

5、结构体传参

可以将结构体作为参数传递给函数，可以通过值传递或者指针传递。通过值传递会拷贝整个结构体，而指针传递只需要传递结构体的地址，可以减少内存的开销。

struct S
{
 int data[1000];
 int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
 printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
 printf("%d\n", ps->num);
}
int main()
{
 print1(s);  //传结构体
 print2(&s); //传地址
 return 0;
}

上面的 print1 和 print2 函数哪个好些？答案是：首选print2函数。

原因：函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

6、结构体实现位段

位段是一种特殊的结构体成员，用于指定成员变量所占的位数。通过使用位段，可以有效地利用存储空间。在位段的布局中，编译器会自动插入填充位来满足对齐要求。但是，位段的布局与机器的字节序有关，可能会导致程序在不同机器上的可移植性问题。

6.1 什么是位段

位段的声明和结构是类似的，有两个不同：

1.位段的成员必须是 int、unsigned int 或signed int 。

2.位段的成员名后边有一个冒号和一个数字。

比如：

struct A {

int _a:2;

int _b:5;

int _c:10;

int _d:30; }

printf("%d\n", sizeof(struct A)); //8

在结构体A中，包含了4个成员变量_a、_b、_c和_d，分别占用了2位、5位、10位和30位。

结构体的大小由各个成员变量的大小及其对齐方式决定。通常情况下，成员变量会按照其自然对齐方式进行对齐，即成员变量的起始位置需要满足其自身大小的整数倍。

根据对齐规则，_a需要2位的存储空间，_b需要5位的存储空间，_c需要10位的存储空间，而最大的成员变量_d需要30位的存储空间。

由于计算机中的最小存储单元是字节（8位），无法以位为单位进行处理，因此需要将位分配转换为字节分配。根据对齐规则，每个成员变量的字节大小为其所占位数除以8。

所以，_a占用2位，即2/8 = 0.25字节，由于最小的单位是字节，所以会向上取整为1字节。

同理，_b占用5位，即5/8 = 0.625字节，向上取整为1字节。

_c占用10位，即10/8 = 1.25字节，向上取整为2字节。

_d占用30位，即30/8 = 3.75字节，向上取整为4字节。

所以，结构体A的总大小为1字节 + 1字节 + 2字节 + 4字节 = 8字节。

6.2 位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

//一个例子
struct S
{
 char a:3;
 char b:4;
 char c:5;
 char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//空间是如何开辟的？

6.3 位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。

3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。 4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：跟结构相比，位段可以达到同样的效果，并且可以很好的节省空间，但是有跨平台的问题存在。

6.4 位段的应用

节省内存空间：使用位段可以有效地节省内存空间，特别是在需要存储大量布尔类型数据或者枚举类型数据时。通过将多个变量压缩到一个字节中，可以减少内存的使用。
位操作：位段允许对单个位进行操作，可以方便地进行位操作，如位的设置、清除、读取等。这对于处理二进制数据、位标志或位掩码非常有用。
提高数据处理效率：位段的使用可以减少数据的读取和存储操作，提高数据处理的效率。尤其在一些嵌入式系统中，对于资源有限的情况下，可以通过位段来高效地处理数据。
位字段的对齐：位段可以通过指定位数来进行对齐操作，利用对齐规则可以更好地控制内存的布局。这在某些特定的应用场景下可以提高数据的访问效率。

二、枚举

枚举顾名思义就是一一列举。把可能的取值一一列举。

1.枚举类型的定义

enum Color//颜色
{
 RED,
 GREEN,
 BLUE
};

{}中的内容是枚举类型的可能取值，也叫 枚举常量 。这些可能取值都是有值的，默认从0开始，依次递增1，当然在声明枚举类型的时候也可以赋初值。例如：

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};

2 .枚举的优点

我们可以使用 #define 定义常量，为什么非要使用枚举？

枚举的优点：

1. 增加代码的可读性和可维护性

2. 和#define定义的标识符比较枚举有类型检查，更加严谨。

3. 便于调试

4. 使用方便，一次可以定义多个常量

3.枚举的使用

enum Color//颜色
{
 RED=1,
 GREEN=2,
 BLUE=4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。
clr = 5;              
/*clr = 5是不合法的。因为5不是Color枚举类型中定义的枚举常量之一。
这会导致类型的差异，编译器会报错。*/

三、联合（共用体）

1 .联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。比如：

//联合类型的声明
union Un
{
 char c;
 int i;
};
//联合变量的定义
union Un un;
//计算连个变量的大小
printf("%d\n", sizeof(un));

联合类型的特点是，它的所有成员共享同一块内存，即同一时间只能存储一个成员的值。

然后，我们定义了一个un的联合变量，它属于联合类型Un。

使用sizeof运算符计算联合变量的大小时，结果是联合中最大成员的大小。在这个示例中，int类型的i成员的大小为4字节（32位系统），所以联合变量un的大小为4字节。

2.联合大小的计算

联合的大小至少是最大成员的大小。

当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

union Un1
{
 char c[5];
 int i;
};
union Un2
{
 short c[7];
 int i;
};
//下面输出的结果是什么？
printf("%d\n", sizeof(union Un1));
printf("%d\n", sizeof(union Un2));

Un1 成员大小成员类型大小默认对齐数最终对齐数
char c[5] 5 1 8 1
int i 4 4 8 4

Un1 最大成员的大小最大对齐数联合的大小
5 4 5+3

Un2 成员大小成员类型大小默认对齐数最终对齐数
short c[7] 14 2 8 2
int i 4 4 8 4

Un2 最大成员的大小最大对齐数联合的大小
14 4 14+2