数组参数退化为指针陷阱

原创于 2025-08-19 11:09:30 发布 · 934 阅读

CC 4.0 BY-SA版权

文章标签：

Day 30：数组参数退化为指针陷阱

上一讲系统梳理了C语言变量和函数的作用域、生命周期及常见陷阱，强调了变量遮蔽、内存管理和命名规范等实践。今天进入 Day 30：数组参数退化为指针陷阱，深入讲解C语言函数参数中的数组与指针混淆、相关底层原理、典型Bug及如何设计更安全的接口。

1. 主题原理与细节逐步讲解

1.1 数组参数退化（Decay）为指针的本质

在C语言中，函数参数声明为数组类型时，实质上传递的是指针，即退化（decay）为指向数组元素类型的指针。
例如，下面两种声明在函数参数中等价：
```
void foo(int a[]);
void foo(int *a);
```
这两者在函数体内完全等价，a都是int*类型。

1.2 退化发生的场景

函数参数：数组类型参数总会自动退化为指向首元素的指针，原有数组长度信息丢失。
表达式求值：除了sizeof、&、字符串常量等特殊场景，数组名通常退化为指针。

2. 相关C语言典型陷阱/缺陷说明及成因剖析

2.1 数组长度信息丢失

由于退化，函数无法获知原始数组长度，只能依靠额外参数或约定传递。
```
void print_arr(int arr[]) {
    printf("%zu\n", sizeof(arr)); // 实际输出指针大小
}
```
输出通常为4或8，而不是整个数组的字节数。

2.2 形式参数的数组维数误导

对于多维数组，只有第一维退化为指针，其余维度必须完整指定，否则类型不匹配。

void foo(int a[][10]); // 正确，a是指向含10个int的数组的指针
void foo(int a[][]);   // 错误，除了第一维，其它必须有长度

2.3 错误地假设`sizeof(参数数组)`能得出数组大小

由于退化，sizeof(arr)得到是指针的大小，不是数组总大小，导致越界或错误的内存操作。

2.4 数组参数声明中的“语法误导”

写作void foo(char str[100])容易让维护者误以为str长度为100，实则函数内部完全得不到这个信息。

3. 规避方法与最佳设计实践

3.1 总是显式传递数组长度

函数接口应总是显式传递数组长度，不要依赖参数声明中的数组大小。
```
void print_arr(const int *arr, size_t len);
```

3.2 用`const`修饰只读数组

明确函数不会修改数组内容时，参数加const，提升接口语义和安全性。

3.3 文档中强调参数退化事实

对于新手加入的项目，接口文档或注释应明确指出“参数为指针，不能用sizeof求长度”。

3.4 多维数组参数的正确声明

除第一维以外，其它维度必须指定长度，并与调用方数据匹配。

3.5 现代C（C99+）推荐用VLA（变长数组）或`static`关键字约束最小长度

void foo(int arr[static 10]); // 保证arr至少有10个元素（C99特性）

4. 典型错误代码与优化后正确代码对比

错误代码1：错误假设能获得数组长度

void print_arr(int arr[]) {
    size_t n = sizeof(arr) / sizeof(arr[0]); // 错误，arr是指针
    for (size_t i = 0; i < n; ++i) {
        printf("%d ", arr[i]);
    }
}

正确代码1：传递长度

void print_arr(const int *arr, size_t n) {
    for (size_t i = 0; i < n; ++i) {
        printf("%d ", arr[i]);
    }
}

错误代码2：多维数组参数声明不规范

void matrix_sum(int mat[][]) { // 错误！必须指定第二维
    // ...
}

正确代码2：

void matrix_sum(int mat[][10], size_t rows) {
    // ...
}

错误代码3：用数组声明误导接口使用者

void foo(char str[100]) {
    // 实际str只是char*
}

误导：维护者以为str长度100，实际无关。

正确代码3：

void foo(const char *str, size_t buflen);

清晰表达数组长度由调用方传递。

5. 必要底层原理补充

C函数参数传递时，数组类型参数会被编译器自动转换为指向首元素的指针，这就是所谓的“退化”。
因为退化，sizeof、_Alignof等操作得到的是指针类型的属性，而非数组本身。
多维数组参数只有最外层会退化为指针，其余层必须完整指明，保证编译器能正确计算元素偏移。

6. 图示：数组参数退化示意

在这里插入图片描述

图示说明：实参数组传递到函数时退化为指针，数组长度信息丢失。

7. 总结与实际建议

C语言函数参数中的数组总是退化为指针，原有长度信息丢失。
不要在函数内部用sizeof或声明数组长度试图获取数组大小。
总是显式传递数组长度或约定结尾元素（如C字符串\0），并在文档中注明。
多维数组参数，第一维可省略长度，其它维必须指定。
接口命名与文档务必清晰，避免误导维护者。

结论：理解数组参数退化机制，规范接口设计，是避免数组越界、数据损毁、接口误用等Bug的关键。写C代码时务必牢记：函数参数的数组只是指针，长度信息需你自己管理！

公众号 | FunIO
微信搜一搜 “funio”，发现更多精彩内容。
个人博客 | blog.boringhex.top