深入理解C语言中的结构体与联合体

最新推荐文章于 2025-05-03 15:12:38 发布

原创最新推荐文章于 2025-05-03 15:12:38 发布 · 1k 阅读

25 ·

CC 4.0 BY-SA版权

文章标签：

#c语言 #开发语言 #数据结构

C语言同时被 2 个专栏收录

21 篇文章

订阅专栏

数据结构与算法

9 篇文章

订阅专栏

在C语言编程中，结构体(struct)和联合体(union)是两种非常重要的复合数据类型，它们为程序员提供了组织和操作复杂数据的强大工具。本文将全面探讨这两种数据类型的特性、用法、区别以及实际应用场景，帮助读者深入理解并掌握它们的精髓。

一、结构体(struct)：数据的完美容器

1.1 结构体的基本概念

结构体是C语言中一种用户自定义的数据类型，它允许将多个不同类型的数据项组合成一个单一的逻辑单元。与数组不同，结构体的成员可以是不同的数据类型，这为数据组织提供了极大的灵活性。

struct Student {
    char name[50];
    int id;
    float gpa;
    char department[30];
};

上面的代码定义了一个表示学生的结构体，包含了姓名、学号、平均绩点和院系四个不同类型的成员。

1.2 结构体的声明与初始化

结构体有多种声明和初始化方式：

方式一：先定义结构体类型，再声明变量

struct Point {
    int x;
    int y;
};

struct Point p1, p2;

方式二：定义结构体类型的同时声明变量

struct Rectangle {
    float width;
    float height;
} rect1, rect2;

方式三：使用typedef创建类型别名

typedef struct {
    char title[100];
    char author[50];
    int pages;
} Book;

Book book1, book2; // 无需再写struct关键字

初始化结构体：

struct Student s1 = {"张三", 2023001, 3.75, "计算机科学"};
struct Point p = {10, 20}; // 顺序初始化

// C99后支持的指定初始化
struct Student s2 = {.name="李四", .gpa=3.8, .id=2023002};

1.3 访问结构体成员

结构体成员可以通过两种方式访问：

使用点运算符(.)：用于结构体变量
使用箭头运算符(->)：用于结构体指针

struct Student s;
strcpy(s.name, "王五");
s.id = 2023003;
s.gpa = 3.6;

struct Student *sp = &s;
printf("学生姓名: %s\n", sp->name);
printf("学生GPA: %.2f\n", sp->gpa);

1.4 结构体的内存布局

理解结构体的内存布局对于编写高效代码非常重要。结构体在内存中的大小通常大于其成员大小之和，这是因为内存对齐(padding)的存在。

struct Example {
    char a;    // 1字节
    // 3字节填充(padding)
    int b;     // 4字节
    short c;   // 2字节
    // 2字节填充
}; // 总大小: 12字节(在32位系统上)

内存对齐可以提高CPU访问内存的效率，但有时也会造成空间浪费。在内存紧张的环境中，可以使用#pragma pack指令来减少填充：

#pragma pack(1) // 1字节对齐
struct PackedExample {
    char a;
    int b;
    short c;
}; // 总大小: 7字节
#pragma pack() // 恢复默认对齐

1.5 结构体的高级用法

结构体数组：

struct Student class[50];
class[0].id = 2023001;
strcpy(class[0].name, "张三");

结构体嵌套：

struct Date {
    int year;
    int month;
    int day;
};

struct Employee {
    char name[50];
    struct Date hire_date;
    float salary;
};

结构体作为函数参数：

结构体可以按值传递，也可以按指针传递。按指针传递更高效，特别是对于大型结构体。

void printStudent(struct Student s) { /* 按值传递 */ }
void updateGPA(struct Student *s, float newGPA) { /* 按指针传递 */ }

二、联合体(union)：共享内存的多面手

2.1 联合体的基本概念

联合体是一种特殊的数据类型，它允许在同一内存位置存储不同的数据类型。联合体的大小是其最大成员的大小，所有成员共享同一块内存空间。

union Data {
    int i;
    float f;
    char str[20];
};

2.2 联合体的使用

union Data data;
data.i = 10;
printf("data.i: %d\n", data.i);

data.f = 220.5;
printf("data.f: %.2f\n", data.f);
// 注意：此时data.i的值已被覆盖

strcpy(data.str, "C Programming");
printf("data.str: %s\n", data.str);

2.3 联合体的内存布局

联合体的所有成员都从同一内存地址开始，它们的值会互相覆盖。联合体的大小等于其最大成员的大小。

union Numeric {
    int i;      // 4字节
    float f;    // 4字节
    double d;   // 8字节
}; // 总大小: 8字节

2.4 联合体的典型应用

1. 节省内存空间

当多个数据不会同时使用时，联合体可以显著节省内存。

struct Product {
    char name[50];
    enum {BOOK, ELECTRONIC} type;
    union {
        struct {
            char author[50];
            int pages;
        } book;
        struct {
            char manufacturer[50];
            float weight;
        } electronic;
    } details;
};

2. 类型转换

联合体可以用于在不同类型之间进行转换而不需要显式类型转换。

union Converter {
    float f;
    unsigned int u;
} converter;

converter.f = 3.14f;
printf("IEEE 754表示: 0x%08x\n", converter.u);

3. 硬件寄存器访问

在嵌入式系统中，联合体常用于访问硬件寄存器。

typedef union {
    struct {
        unsigned int mode : 3;
        unsigned int enable : 1;
        unsigned int reserved : 28;
    } bits;
    uint32_t word;
} ControlRegister;

三、结构体与联合体的比较

特性	结构体(struct)	联合体(union)
内存分配	各成员有独立内存空间	所有成员共享同一内存空间
大小	至少是所有成员大小之和(考虑对齐)	等于最大成员的大小
成员访问	所有成员可同时有效	同一时间只有一个成员有效
初始化	可以同时初始化所有成员	只能初始化第一个成员
典型用途	组合相关数据	节省内存或表示多种类型的数据
内存效率	较低(可能有填充)	高(无重复内存使用)
数据持久性	修改一个成员不影响其他成员	修改一个成员会覆盖其他成员

四、高级主题与技巧

4.1 匿名结构体和联合体(C11)

C11标准引入了匿名结构体和联合体，可以简化嵌套结构体的访问。

struct Person {
    char name[50];
    union {
        int age;
        float height;
    }; // 匿名联合体
};

struct Person p;
p.age = 25; // 直接访问，无需指定联合体名称

4.2 灵活数组成员(Flexible Array Member)

C99引入了灵活数组成员，允许结构体最后一个成员是大小不确定的数组。

struct DynamicString {
    int length;
    char data[]; // 灵活数组成员
};

struct DynamicString *createString(int length) {
    struct DynamicString *s = malloc(sizeof(struct DynamicString) + length);
    s->length = length;
    return s;
}

4.3 位域(Bit Fields)

位域允许我们精确控制结构体成员占用的位数，这在嵌入式系统和协议处理中非常有用。

struct StatusRegister {
    unsigned int ready : 1;
    unsigned int error : 1;
    unsigned int mode : 2;
    unsigned int : 4; // 未使用的位
    unsigned int value : 8;
};

4.4 结构体与联合体的组合使用

结构体和联合体可以组合使用，创建复杂的数据结构。

union Variant {
    int int_value;
    float float_value;
    char *string_value;
    struct {
        int type;
        union {
            int i;
            float f;
            char *s;
        } value;
    } tagged;
};

五、实际应用案例

5.1 文件格式解析

结构体非常适合解析二进制文件格式，如BMP图像文件头。

#pragma pack(1) // 禁用填充，确保准确映射
typedef struct {
    char signature[2];
    uint32_t file_size;
    uint16_t reserved1;
    uint16_t reserved2;
    uint32_t data_offset;
} BMPHeader;
#pragma pack()

5.2 网络协议处理

联合体可以简化网络协议中不同类型数据的处理。

union IPAddress {
    uint32_t address; // 作为32位整数
    struct {
        uint8_t byte1;
        uint8_t byte2;
        uint8_t byte3;
        uint8_t byte4;
    } bytes; // 作为4个字节
};

5.3 变体记录系统

联合体可以实现类似其他语言中的变体类型(variant)。

struct Variant {
    enum { INT, FLOAT, STRING } type;
    union {
        int i;
        float f;
        char *s;
    } value;
};

void printVariant(struct Variant v) {
    switch(v.type) {
        case INT: printf("%d\n", v.value.i); break;
        case FLOAT: printf("%f\n", v.value.f); break;
        case STRING: printf("%s\n", v.value.s); break;
    }
}