《C语言进阶之自定义类型详解——结构体、位段、枚举、联合详解》

最新推荐文章于 2025-11-24 23:30:00 发布

原创最新推荐文章于 2025-11-24 23:30:00 发布 · 272 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#c语言 #开发语言

本文详细介绍了C语言中的结构体、位段、枚举和联合的概念、声明方法、内存对齐规则以及使用注意事项，包括结构体的自引用、内存对齐原则、结构体传参优化以及位段的局限性等。

hello，各位小伙伴们大家好！

今天小风将带着大家进行C语言中有关结构的学习，在C语言的结构模块中包含结构体、位段、枚举、联合四大部分的内容，由于结构这一块的内容与数据结构的学习息息相关（重点），所以小风将会花比较大的篇幅讲解这块知识的内容（其中会穿插很多的图解尽可能的使大家能够吸收和理解）。

以下是本篇文章讲解的主要内容（大家可以根据实际所需进行检索）：

结构体

结构体类型的声明
结构的自引用
结构体变量的定义和初始化
结构体内存对齐
结构体传参
结构体实现位段（位段的填充&可移植性）

枚举

枚举类型的定义
枚举的优点
枚举的使用

联合

联合类型的定义
联合的特点
联合大小的计算

1.6 结构体内存对齐（结构体所占空间大小的规则）

一、结构体

1.结构体类型的声明

1.1结构的基础知识

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2结构的声明

声明方式一

struct tag  //"tag"指的是该结构提的类型名
{
    member-list;  //成员变量列表
}variable-list;  //这里指的声明的是该结构体变量，该处内容是可以省略，在后面定义结构体变量同样是可行的

例如现在我们以这种方式来描述一个学生

struct Stu
{
    char name[20];//名字
    int age;//年龄
    char sex[5];//性别
    char id[20];//学号
}; //分号不能丢

声明方式二

//使用typedef进行重定义结构体类型
typedef struct tag  //重定义“struct tag”类型
{
    member-list;  //成员变量列表
}Tag;  //Tag -> 注意此时这里已不再是结构体变量了，而是结构体类型， 
       //此时等同于struct tag，可以用于声明结构体变量

利用该种方式定义一个学生

typedef struct Stu
{
    char name[20];//名字
    int age;//年龄
    char sex[5];//性别
    char id[20];//学号
}Stu; //分号不能丢

可能在这里有些小伙伴一定会有这样的一个疑问：这两种声明方式有什么区别和用途呢？

其实在这里其实它们本身并没有什么区别，都是声明了一个结构体变量，但相较于第一中声明方式第二种声明方式的优势在于当我们需要创建结构体变量时，不用再加上struct关键字，具体去别如下所示：

//方式一创建学生结构体变量
struct Stu student;


//方式二创建学生结构体变量
Stu student;

因此当我们需要创建多个结构体变量时，无疑是第二种方式更为方便和简洁。

1.3特殊的声明（匿名声明）

在某些结构体声明的时候，还可已进行不完全声明。如下：

//匿名结构体类型
struct
{
    int a;
    char b;
    float c;
}x;
struct
{
    int a;
    char b;
    float c;
}a[20], *p;

上面的两个结构在生命的时候省略掉了结构体标签（tag），而且我们通过观察可以发现这两个结构体的声明内容似乎是完全相同的。那么小风的问题来了：

//在上面代码的基础之上，下面的代码合法吗？？
p = &x;

在这里我们一定需要注意：编译器编译器会把上面的两个声明当成完全不同的两个类型，也就是说结构体指针变量p类型与结构体变量x的数据类型是不一致的，一定并不能想当然的将声明形式一样的两个结构体看成是等价的。

所以上面这段代码是不合法的！

1.4结构体的自引用

结构体的自引用可以理解为在结构体中它包含了自己。

问题思考：在结构中包含一个类型为该结构本身的成员是否可以呢，应该如何使用自引用才是正确的呢？

这里小风总结了一个判断是否可行的结论：如果我们在自引用过程中，自引用的结构体所占的空间大小是可以计算的，那么我们称这种自引用的方式是正确的，否则是不可行的。

例如下面这段代码

//代码1
struct Node
{
    int data;
    struct Node next;
};
//可行否？
//如果可以，那sizeof(struct Node)是多少？

这是一段错误的自引用方式，因为我们发现当我们想要计算该结构体的大小时，会发现结构体无限嵌套了自己，所以这种写法是不可行的。正确的自引用方式如下：

//代码2
struct Node
{
    int data;
    struct Node* next;
};

利用指针来指向结构体，为什么这种方式是可行的呢？

因为我们知道指针存储的是地址，它本身所占的空间大小也是固定的（4/8个字节，具体大小取决于环境32位或64位），所以这种自引用的方式是可行的。

注意犯以下这种错误

//代码3
typedef struct
{
    int data;
    Node* next;
}Node;
//这样写代码，可行否？

//解决方案：
typedef struct Node
{
    int data;
    struct Node* next;  //struct可省
}Node;

在上述代码三中，结构体中提前引用了结构体类型名导致了系统同并无法识别此处的Node机构体类型是来自哪里，就像犯了先有鸡还是现有单的问题。

1.5结构体变量的定义和初始化

当我们有了结构体类型，那如何定义结构体变量，其实就比较简单了。具体如下所示：

struct Point
{
	int x;
	int y;
}p1; //声明类型的同时定义变量p1

struct Point p2; //定义结构体变量p2

//初始化：定义变量的同时赋初值。
struct Point p3 = { x, y };

struct Stu //类型声明
{
	char name[15];//名字
	int age; //年龄
};

struct Stu s = { "zhangsan", 20 };//初始化

struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化

struct Node n2 = { 20, {5, 6}, NULL };//结构体嵌套初始化

上述的代码中结构体变量的初始化采用的都是顺序填充值，除此之外其实还可以进行无序的的方式（大家了解即可）

struct Point
{
    int x;
    int y;
}; 

struct Node
{
	int data;
	struct Point p;
	struct Node* next;
}n1 = { 10, {4,5}, NULL }; //结构体嵌套初始化

struct Node n2 = { .p = {5, 6}, .data = 20, .next = NULL };//无序初始化

1.6 结构体内存对齐（结构体所占空间大小的规则）

我们已经掌握了结构体的基本使用了。现在我们深入讨论一个问题：计算结构体的大小。这也是一个特别重要的知识点。
首先得掌握结构体的对齐规则：

第一个成员在与结构体变量偏移量为0的地址处。
其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。VS中默认的值为8
结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

在这里小风觉得有些小伙伴可能对以上内容不太理解，因为上述规则中涉及了一些专业术语，比如：偏移量、对齐数。

偏移量：指的是所计算的结构体成员，相较于结构体所占空间的起始位置的距离（单位为字节）称之为偏移量。

对齐数：它的单位同样是字节，一般情况下每种编译器都会有自己的默认的对齐数，而成员自身的对齐数指的是它占用空间的大小，每个成员的对齐数的大小取得是这两者之间的较小值。

通过上述规则我们来理解以下案例中所涉及的结构体的大小：

（1）练习一

int main()
{
	//练习1
	struct S1
	{
		char c1;
		int i;
		char c2;
	};
	printf("%zd", sizeof(struct S1));
	return 0;
}

通过上述结果可知结构体S1所占空间大小为12个字节，这是否与我们大家所设想不太一样？接下来小风将带着大家如何运用我们的规则所得出运行出的结果的。

思考题：如果将上述结构体中的变量打乱顺序，结构体的大小会发生什么样的变化呢

（2）练习二

int main()
{
	//练习2:计算S4嵌套结构体的大小
	struct S3
	{
		double d;
		char c;
		int i;
	};

	struct S4
	{
		char c1;
		struct S3 s3;
		double d;
	};
	printf("%d\n", sizeof(struct S4));
	return 0;
}

通过运行结果可知结构体S4所占空间的大小为32个字节，这里小风就不再为大家进行图解了，首先计算的方式还是一样的。值得注意的是这道练习题运用到了规则4，嵌套结构体的对齐数是对齐到自己最大对齐数的整数倍处；结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍。

为什么存在内存对齐？

平台原因(移植原因)：
不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因：
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需一次访问。

总体来说：结构体的内存对齐是拿空间来换取时间的做法。

1.7结构体的传参

请大家思考一下以下代码中的两种传参方式，面的 print1 和 print2 函数哪个好些？

struct S
{
    int data[1000];
    int num;
};
struct S s = {{1,2,3,4}, 1000};

//结构体传参
void print1(struct S s)
{
    printf("%d\n", s.num);
}

//结构体地址传参
void print2(struct S* ps)
{
    printf("%d\n", ps->num);
}

int main()
{
    print1(s); //传结构体
    print2(&s); //传地址
    return 0;
}

答案是：首选print2函数。
原因：函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

因此结构体传参要传结构体的地址！

2.位段

2.1什么是位段

位段的声明和结构是类似的，有两个不同：

位段的成员必须是 int、unsigned int 或signed int 。
位段的成员名后边有一个冒号和一个数字。

例如：下面A就是一个位段类型

struct A
{
    int _a:2;  //2×4个字节
    int _b:5;  //×4个字节
    int _c:10;  //10×4个字节
    int _d:30;  //30×4个字节
};

2.2位段的内存分配

位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型
位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

//一个例子
struct S
{
    char a:3;
    char b:4;
    char c:5;
    char d:4;
};
int main()
{
    struct S s = {0};
    s.a = 10;
    s.b = 12;
    s.c = 3;
    s.d = 4;
}
//空间是如何开辟的？

图解如下

2.3 位段的跨平台问题

int 位段被当成有符号数还是无符号数是不确定的。
位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

3.枚举

枚举顾名思义就是一一列举，把可能的取值一一列举。
比如我们现实生活中：

一周的星期一到星期日是有限的7天，可以一一列举。
性别有：男、女、保密，也可以一一列举。
月份有12个月，也可以一一列举

3.1枚举类型的定义

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};
enum Sex//性别
{
	MALE,
	FEMALE,
	SECRET
}；
enum Color//颜色
{
	RED,
	GREEN,
	BLUE
};

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。{}中的内容是枚举类型的可能取值，也叫枚举常量。这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。
例如：

enum Color//颜色
{
    RED=1,
    GREEN=2,
    BLUE=4
};

3.2枚举的优点

我们可以使用 #define 定义常量，为什么非要使用枚举？
枚举的优点：

增加代码的可读性和可维护性
和#define定义的标识符比较枚举有类型检查，更加严谨。
防止了命名污染（封装）
便于调试
使用方便，一次可以定义多个常量

3.3枚举的使用

enum Color//颜色
{
	RED = 1,
	GREEN = 2,
	BLUE = 4
};
enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值，才不会出现类型的差异。

在这里特别指出对枚举类型的变量赋值时最好使用定义的枚举常量进行赋值，而不是使用整型常量。

下面这种方式是错误的，很有可能出现类型不匹配的提示错误信息！

clr = 5;  //这种方式是错误的

4.联合（共用体）

4.1联合类型的定义

联合也是一种特殊的自定义类型。这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。

//联合类型的声明
union Un
{
    char c;
    int i;
};

//联合变量的定义
union Un un;

//计算连个变量的大小
printf("%d\n", sizeof(un));

4.2联合的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联
合至少得有能力保存最大的那个成员）。

我们一起来看一下以下代码的输出结果：

#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>

int main()
{
	union Un
	{
		int i;
		char c;
	};

	union Un un;

	// 下面输出的结果是一样的吗？
	printf("i的地址%d\n", &(un.i));
	printf("c的地址%d\n\n", &(un.c));

	//下面输出的结果是什么？
	un.i = 0x11223344;
	printf("写入c前：%x\n", un.i);
	un.c = 0x55;
	printf("写入c后：%x\n", un.i);
	return 0;
}

运行结果

通过上述案例很清晰的可以观察到，联合中的各个成员共同占用同一块空间。

4.3 联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。

例如下面这段代码示例：

#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>

int main()
{
    union Un1
    {
        char c[5];
        int i;
    };
    union Un2
    {
        short c[7];
        int i;
    };
    //下面输出的结果是什么？
    printf("%d\n", sizeof(union Un1));
    printf("%d\n", sizeof(union Un2));
	return 0;
}

运行结果如下