42、深入探索 printf：调试利器的全方位解析

杠精协会主席

于 2025-12-07 13:41:45 发布

阅读量9

点赞数

CC 4.0 BY-SA版权

分类专栏： Linux程序员的实战宝典文章标签： printf 调试预处理器宏

本文链接：https://blog.youkuaiyun.com/docker7nomad/article/details/155909972

Linux程序员的实战宝典专栏收录该内容

49 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深入探索 printf：调试利器的全方位解析

1. 文件同步函数：fsync 与 fdatasync

在文件操作中， fsync 和 fdatasync 是两个重要的同步函数，它们用于确保数据被写入设备。不过，二者存在差异： fdatasync 仅将用户数据写入设备，而 fsync 除了写入用户数据外，还会更新文件系统元数据。

需要注意的是，这两个函数的参数是文件描述符，而非文件流。因此，它们不能替代 fflush 或 setvbuf 对文件流的调用，而是需要与之配合使用。可以使用 fileno 函数获取任何 C 文件流的文件描述符。以下是一个使用示例：

printf("Hello World\n");
fflush(stdout);
// Flush the file stream buffer (in user space); must be done first.
fsync(fileno(stdout));
// Flush the file-system buffer (in kernel space).

另外， fread 的行为可能与预期不同。GLIBC 并不将用户空间缓冲区用作传统意义上的缓存，它仅用于合并读写操作，使底层系统调用使用更大的块。虽然可能会从缓冲区获取到陈旧数据，但可以在调用 fread 之前调用 fseek 来避免这种情况，这将使 fread 更新缓冲区中的数据。

2. 有效使用 printf

在使用 printf 时，了解何时不使用它或许是最重要的一点。若无法避免使用，至少在不需要时将其关闭。

2.1 预处理器的帮助

C 预处理器在格式化和控制调试消息方面非常有用。一种实用的方法是将 printf 调用封装在宏中，这样可以减少代码的杂乱，并且在不需要时轻松移除消息。例如：

#ifdef DEBUG
#define DEBUGMSG(...) printf(__VA_ARGS__)
// Uses a C99 / GNU extension
#else
#define DEBUGMSG /* nop */
#endif

使用宏中的可变参数列表最初是 GNU 扩展，后来被 C99 标准采用。如果使用的是非 GNU 编译器或不支持 C99 扩展的编译器，可以使用更笨拙的替代语法来实现可变参数列表的效果：

#define DEBUGMSG(msg) printf msg
// Caller passes in the parentheses.
// Only works like this ...
DEBUGMSG(("Hello World %d\n",123));
// becomes printf("Hello World %d\n",123);

将 printf 调用封装在宏中还可以隐藏一些原本可能有用但不太美观的代码。可以在每个消息中包含文件名和行号，如下所示：

#define DEBUGMSG(fmt,...) printf("%s %d " fmt, __FILE__,__LINE__, ## __VA_ARGS__)

这里的双井号 ## 是 GNU 独有的扩展。当与 __VA_ARGS__ 一起使用时，如果格式字符串不接受参数，它会为你去除尾随逗号。

以下是一些使用 C 预处理器的 printf 技巧：
- 以最少的输入打印变量到屏幕 ：

#define PHEX(x)printf("%#10x %s\n", x, #x)
...
PHEX(foo);
PHEX(bar);
PHEX(averylongname);

这个技巧使用 # 字符将宏参数用引号括起来，预处理器会将以 # 开头的参数用引号括起来，从而节省输入。同时，将值放在左边的固定宽度字段中，使输出更易于阅读。
- 内联同步 ：

#define DEBUGMSG(...) \
do { \
    printf(__VA_ARGS__);\
    fflush(stdout);\
} while(0)

这种方式将同步操作封装在宏中，减少代码的杂乱。不过，如果代码块不断增长，可能会影响代码大小，此时可以考虑创建一个函数。

2.2 使用 `do / while(0)` 宏

在 Linux 内核源代码中广泛使用 do / while(0) 模式。当宏包含多个语句时，不使用花括号定义宏是危险的。例如，以下简单宏在语法上正确但存在缺陷：

#define EXITMSG(msg)
    printf(msg); exit(EXIT_FAILURE)

使用这个宏时，可能会导致意外的行为。一个直观的修复方法是添加花括号：

#define EXITMSG(msg)
{ printf(msg); exit(EXIT_FAILURE); }

但在某些上下文中仍然存在问题。正确的做法是将代码块放在 do/while 语句中：

#define EXITMSG(msg) \
do { printf(msg); exit(EXIT_FAILURE); } while(0)

这样，代码块被完美封装，可以在任何上下文中使用，并且优化器可以省略不必要的循环代码。

3. 使用包装函数

仅使用预处理器来控制打印输出存在一些缺点。例如，宏没有函数签名，调用宏时出现的语法错误可能会产生误导性的错误消息。

一种替代方法是将代码封装在函数中。虽然函数调用会增加开销，但 C++、C99 和 gcc 支持的 inline 关键字可以减少这种开销。内联函数实际上不会被调用，编译器会将编译后的指令直接放在调用处。

以下是一个简单的 printf 包装函数示例：

inline int myprintf( const char *fmt, ... )
{
    int n;
    va_list ap;
    // va_list holds the information needed for the API.
    va_start(ap, fmt);
    // Indicate where the variable arguments start (i.e.. after fmt).
    n = vprintf(fmt,ap);
    // vprintf takes a format string and a va_list.
    va_end(ap);
    // Must call this before exiting the function.
    return n;
}

创建 printf 的包装函数会禁用可变参数的类型检查。不过，GNU 提供了 __attribute__ 指令来解决这个问题：

inline int myprintf( const char *fmt, ... )
__attribute__ ((format (printf, 1, 2)));

这个指令告诉编译器该函数遵循 printf 格式化规则，格式字符串在参数 1 中，第一个格式参数从参数 2 开始。需要注意的是， __attribute__ 指令仅在 GNU 编译器中可用，不具有可移植性。

4. 不要忽视 printf 格式警告

printf 的格式警告虽然大多是可移植性问题，不一定是 bug，但也有一些警告需要关注。

数据类型	警告示例（gcc 3.x）	警告示例（gcc 4.x）	影响及处理方法
整数类型	warning: int format, long int arg (arg 2) warning: long unsigned int format, int arg (arg 2)	-	C 标准对 `int` 和 `long` 的大小定义不明确，gcc 中 32 位架构的 `long` 和 `int` 大小通常相同，一般不会因参数大小导致输出错误，但仍需留意
64 位类型	warning: int format, different type arg	warning: format ‘%x’ expects type ‘unsigned int’, but argument 2 has type ‘off_t’	`off_t` 类型大小取决于编译器标志，64 位类型作为整数或长整数格式的参数时，输出可能不正确，后续参数也可能受影响，甚至导致程序崩溃。不同架构下 `printf` 格式要求不同，需根据实际情况调整
浮点类型	warning: int format, double arg (arg 2)	warning: format ‘%d’ expects type ‘int’, but argument 2 has type ‘double’	混合浮点和整数类型很危险， `double` 类型为 64 位， `float` 会被提升为 `double` ，使用 `float` 作为整数格式参数可能导致严重问题，需注意参数类型匹配
字符串类型	warning: format argument is not a pointer (arg 2) warning: char format, different type arg (arg 2)	warning: format ‘%s’ expects type ‘char ’, but argument 2 has type ‘int’ warning: format ‘%s’ expects type ‘char ’, but argument 2 has type ‘int *’	字符串类型容易出错，因为使用指针作为参数，指针可能出现各种问题，相关代码可能导致运行时崩溃，看到警告应检查并修复代码，若代码正确可使用显式类型转换消除警告

以下为处理这些警告的 mermaid 流程图：

graph TD
    A[遇到 printf 格式警告] --> B{是否为整数类型警告}
    B -- 是 --> C{是否影响输出正确性}
    C -- 否 --> D[留意即可]
    C -- 是 --> E[检查并调整参数类型]
    B -- 否 --> F{是否为 64 位类型警告}
    F -- 是 --> G{是否在不同架构下编译}
    G -- 是 --> H[根据架构调整 printf 格式]
    G -- 否 --> I[检查并调整参数类型]
    F -- 否 --> J{是否为浮点类型警告}
    J -- 是 --> K[检查并调整参数类型，避免混合类型]
    J -- 否 --> L{是否为字符串类型警告}
    L -- 是 --> M[检查代码，修复指针问题或使用显式类型转换]
    L -- 否 --> N[检查其他可能的错误]

5. 创建良好调试消息的提示

5.1 使用易于识别的格式

采用一致的格式可以让你一眼看出程序的运行情况，而无需逐行阅读打印输出。例如，将调试信息统一格式后，可以更清晰地突出错误信息：

info - The last time I checked, the DVD drive is within defined tolerances.
info - Relax, the hard drive is running.
info - The USB port is not in flames.
info - It's a good thing that the PCI bus is running.
info - I'm optimistic because the USB port is better.
**** ERROR - Don't panic, but the DVD drive is going to explode.
info - The last time I checked, the heap is optimal.
info - The mouse is not in flames.
info - Everything's fine, I checked and the memory is running at full speed.

创建自己的 printf 包装函数可以强制输出具有可预测的格式，但无法帮助你区分相关和无关信息。

5.2 每条消息一行

将消息压缩在一行可能会使消息变得晦涩难懂，但这样做也有好处。例如，如果程序将大量打印输出到文件中，可以使用简单的 grep 命令查找特定消息。

综上所述， printf 作为最基本的调试工具，虽然看似简单，但在实际使用中需要注意诸多细节。通过合理运用预处理器、包装函数，以及关注格式警告和调试消息的格式，可以更高效地使用 printf 进行调试工作。

深入探索 printf：调试利器的全方位解析

6. 关键技术点总结与分析

前面介绍了 printf 相关的多种技术和方法，下面对这些关键技术点进行总结和分析，以帮助读者更好地理解和运用。

技术点	优点	缺点	适用场景
预处理器宏封装 `printf`	- 减少代码杂乱 - 方便控制调试消息的显示与隐藏 - 可包含文件名和行号等额外信息	- 无函数签名，缺乏参数检查 - 语法错误可能产生误导性消息	调试阶段需要灵活控制消息输出，且对代码简洁性有要求的场景
包装函数	- 有函数签名，增强错误检查和警告 - 可利用 `inline` 关键字减少函数调用开销	- 禁用可变参数的类型检查（需 GNU 扩展解决） - 增加代码大小	需要严格的参数检查，且对函数调用开销不太敏感的场景
`do / while(0)` 宏	- 封装代码块，可在任何上下文使用 - 优化器可省略不必要的循环代码	- 代码理解难度稍高	宏包含多个语句，需要确保在各种上下文中正确执行的场景

7. 实际应用案例

为了更好地说明上述技术的实际应用，下面给出一个综合示例。假设我们正在开发一个简单的文件处理程序，需要在调试阶段输出详细的信息。

#include <stdio.h>
#include <stdlib.h>
#include <stdarg.h>

// 预处理器宏封装 printf
#ifdef DEBUG
#define DEBUGMSG(fmt, ...) printf("%s %d " fmt, __FILE__, __LINE__, ## __VA_ARGS__)
#else
#define DEBUGMSG(...) /* nop */
#endif

// 包装函数
inline int myprintf(const char *fmt, ...) __attribute__((format(printf, 1, 2)));
inline int myprintf(const char *fmt, ...)
{
    int n;
    va_list ap;
    va_start(ap, fmt);
    n = vprintf(fmt, ap);
    va_end(ap);
    return n;
}

// 内联同步宏
#define DEBUGMSG_SYNC(...) \
do { \
    myprintf(__VA_ARGS__); \
    fflush(stdout); \
} while(0)

// 打印变量到屏幕的宏
#define PHEX(x) myprintf("%#10x %s\n", x, #x)

// 退出消息宏
#define EXITMSG(msg) \
do { \
    myprintf(msg); \
    exit(EXIT_FAILURE); \
} while(0)

int main()
{
    FILE *fp;
    int num = 123;
    long long large_num = 0x123456789ABCLL;
    char *str = "Hello, World!";

    DEBUGMSG_SYNC("Starting file processing...\n");

    PHEX(num);
    PHEX(large_num);

    fp = fopen("test.txt", "r");
    if (fp == NULL) {
        EXITMSG("Failed to open file!\n");
    }

    DEBUGMSG_SYNC("File opened successfully.\n");

    // 读取文件内容等操作...

    fclose(fp);
    DEBUGMSG_SYNC("File closed.\n");

    return 0;
}

在这个示例中，我们综合运用了预处理器宏、包装函数、内联同步宏等技术。通过 DEBUGMSG 宏可以方便地控制调试消息的输出， myprintf 包装函数提供了参数检查功能， PHEX 宏可以快速打印变量及其名称， EXITMSG 宏确保在出现错误时能正确输出消息并退出程序。

8. 总结与建议

printf 作为最基本的调试工具，在软件开发中具有重要的作用。通过合理运用预处理器、包装函数、宏等技术，可以提高调试效率，减少潜在的错误。以下是一些总结和建议：
- 预处理器的运用 ：在调试阶段，使用预处理器宏可以灵活控制调试消息的输出，方便开发人员快速定位问题。但要注意宏的使用可能会带来一些语法和参数检查方面的问题。
- 包装函数的选择 ：如果对参数检查有较高要求，可以考虑使用包装函数。虽然会增加一定的代码大小，但能提高代码的健壮性。同时，利用 inline 关键字可以减少函数调用开销。
- 格式警告的处理 ：不要忽视 printf 的格式警告，尤其是涉及 64 位类型、浮点类型和字符串类型的警告，这些警告可能会导致程序运行时出现严重问题。
- 调试消息的格式 ：采用一致的格式和每条消息一行的原则，可以使调试信息更易于阅读和分析。

总之，掌握 printf 的各种使用技巧和注意事项，能够让开发人员在调试过程中更加得心应手，提高软件开发的质量和效率。

以下是一个总结上述流程的 mermaid 流程图：

graph LR
    A[开发程序] --> B{是否需要调试信息}
    B -- 是 --> C{选择控制方式}
    C -- 预处理器宏 --> D[封装 printf 调用]
    C -- 包装函数 --> E[创建包装函数并使用 inline 关键字]
    D --> F[使用宏控制消息输出]
    E --> G[利用函数签名进行参数检查]
    F --> H{是否有格式警告}
    G --> H
    H -- 是 --> I{警告类型}
    I -- 64 位类型 --> J[调整格式和参数类型]
    I -- 浮点类型 --> K[确保类型匹配]
    I -- 字符串类型 --> L[检查指针并修复或转换类型]
    I -- 其他 --> M[检查代码]
    H -- 否 --> N[继续开发]
    J --> N
    K --> N
    L --> N
    M --> N
    B -- 否 --> N

通过这个流程图，可以清晰地看到在开发过程中如何运用 printf 相关技术进行调试，以及如何处理可能出现的格式警告。希望读者在实际开发中能够灵活运用这些方法，提升调试效率和代码质量。