C语言字符串处理相关函数详解

最新推荐文章于 2025-04-03 17:19:13 发布

小灰灰搞电子

最新推荐文章于 2025-04-03 17:19:13 发布

阅读量953

点赞数 19

分类专栏： C语言文章标签： c语言

本文链接：https://blog.youkuaiyun.com/qq_15181569/article/details/146815940

版权

C语言专栏收录该内容

2 篇文章

订阅专栏

C语言字符串处理相关函数详解

相关函数详解
在C语言中，如何安全地使用字符串处理函数来避免缓冲区溢出等常见安全问题？

在C语言中，如何安全地使用字符串处理函数来避免缓冲区溢出等常见安全问题？

在 C 语言中，因为字符串实际上是以空字符 \0 结尾的字符数组，错误处理字符串的方式可能会导致缓冲区溢出（Buffer Overflow）以及未定义行为等问题，从而引发安全风险。以下是一些注意事项和安全实践，帮助您在使用字符串处理函数时避免这些常见的问题：

1. 确保目标缓冲区大小足够

缓冲区溢出常发生在目标缓冲区（destination）的大小不足以容纳输入内容时，如 strcpy 或 strcat 等函数会将整个源字符串拷贝到目标缓冲区而不进行边界检查。

解决方案：使用长度限制的函数

使用有长度限制的函数，例如：
- strncpy 替代 strcpy
- strncat 替代 strcat
始终显式声明并检查目标缓冲区的大小，确保总长度不会超过缓冲区。

示例：

#include <string.h>
#include <stdio.h>

void safe_copy() {
    char src[] = "Hello, World!";
    char dest[10]; // 缓冲区只有10个字符（不够容纳src）

    // 使用 strncpy 替代 strcpy，最多拷贝 9 个字符，留出一个位置给 '\0'
    strncpy(dest, src, sizeof(dest) - 1);
    dest[sizeof(dest) - 1] = '\0'; // 手动添加字符串结束符
    printf("Copied string: %s\n", dest); // 输出结果 "Hello, Wo"
}

2. 正确终止字符串

有些字符串函数（如 strncpy）不会自动在字符串结尾添加 NUL 字符 \0，这可能导致未终止的字符串引发未定义行为。

解决方案：手动添加终止符

确保显式添加空字符 \0，尤其是在长度限制的拷贝操作中。

示例：

char src[] = "Hello";
char dest[10];
strncpy(dest, src, sizeof(dest) - 1);
dest[sizeof(dest) - 1] = '\0'; // 确保字符串以 '\0' 结尾

3. 避免目标缓冲区内存不足

一些函数（例如 strcat 和 strcpy）假定目标缓冲区有足够的空间。如果目标缓冲区不足以容纳拼接或拷贝的内容，会导致缓冲区溢出。

解决方案：始终检查缓冲区大小

在执行操作之前，计算源字符串与目标缓冲区的大小关系，以确保不会发生溢出。

示例：

#include <string.h>
#include <stdio.h>

void safe_concat() {
    char src[] = "World!";
    char dest[20] = "Hello, ";

    // 检查 dest 是否足够大
    if (strlen(dest) + strlen(src) + 1 <= sizeof(dest)) {
        strcat(dest, src); // 安全拼接
        printf("Concatenated string: %s\n", dest);
    } else {
        printf("Buffer overflow risk avoided!\n");
    }
}

4. 使用更安全的函数

许多 C 标准库函数（如 strcpy, strcat）存在已知问题，现代 C 标准库或第三方库提供了更安全的替代函数，例如：

POSIX扩展函数（如 strlcpy, strlcat）：

strlcpy 和 strlcat 是更安全的拷贝和拼接函数，它们始终保证目标字符串是以 \0 结尾的，并不会导致缓冲区溢出。

示例：

#include <string.h> // POSIX 标准

char src[] = "Hello, World!";
char dest[10];

// strlcpy: 拷贝最多 sizeof(dest) - 1 个字符，并确保以 '\0' 结尾
strlcpy(dest, src, sizeof(dest));
printf("Destination: %s\n", dest);

5. 使用动态分配内存

如果目标缓冲区的大小是未知且不可固定的，采用动态内存分配（如 malloc 和 free）可以避免缓冲区溢出的问题。

示例：

#include <stdlib.h>
#include <string.h>
#include <stdio.h>

void dynamic_allocation() {
    char src[] = "Hello, dynamically allocated world!";
    char *dest = malloc(strlen(src) + 1); // 动态分配精确大小

    if (dest == NULL) {
        fprintf(stderr, "Memory allocation failed.\n");
        return;
    }

    strcpy(dest, src); // 安全拷贝
    printf("Copied string: %s\n", dest);

    free(dest); // 释放内存
}

6. 避免使用不安全的函数

一些函数完全不应该使用，特别是在处理未受信任的数据时。例如：

gets (已废弃 in C11)：因为它完全不限制输入的大小，极易引发缓冲区溢出。
替代：使用 fgets。

示例：

#include <stdio.h>

void read_input() {
    char buffer[20];

    // fgets 会限制输入大小，避免缓冲区溢出
    printf("Enter a string: ");
    if (fgets(buffer, sizeof(buffer), stdin) != NULL) {
        printf("You entered: %s\n", buffer);
    }
}

7. 小心使用 `strtok` （非线程安全）

strtok 全局维护状态，无法在多线程中安全使用。使用 strtok_r 它的线程安全版本（POSIX 提供）。

示例：

#include <stdio.h>
#include <string.h>

void tokenize() {
    char str[] = "Hello,World,2023";
    char *saveptr;
    char *token = strtok_r(str, ",", &saveptr); // 使用 strtok_r 替代 strtok
    while (token != NULL) {
        printf("Token: %s\n", token);
        token = strtok_r(NULL, ",", &saveptr);
    }
}

8. 输入验证和边界检查

用户输入的内容可能过长或恶意，必须在读取数据时验证边界，避免安全问题。

示例：

#include <stdio.h>
#include <string.h>

void read_and_validate() {
    char buffer[50];

    // 读取用户输入，但限制长度为 sizeof(buffer) - 1
    printf("Enter input: ");
    if (fgets(buffer, sizeof(buffer), stdin) != NULL) {
        // 检查并去除末尾换行符
        size_t len = strlen(buffer);
        if (len > 0 && buffer[len - 1] == '\n') {
            buffer[len - 1] = '\0';
        }
        printf("Validated input: %s\n", buffer);
    }
}