安全拷贝函数safe_memcpy实现分析

最新推荐文章于 2025-10-29 17:10:37 发布

原创

最新推荐文章于 2025-10-29 17:10:37 发布 · 2.9k 阅读

10 ·

CC 4.0 BY-SA版权

本文详细分析了标准库函数memcpy的潜在风险，如缓冲区溢出和地址重叠问题。随后，介绍了safe_memcpy的实现，旨在增强内存操作的安全性，通过指定拷贝范围避免错误。通过实例演示，展示了如何使用safe_memcpy来确保程序健壮性。

一 memcpy缺陷分析

1.memcpy原型：

#include <string.h>
void *memcpy(void *dest, const void *src, size_t n); #函数返回dest指针

2.缺陷分析：

（1）memcpy容易发生缓冲区溢出，如果dest长度小于待拷贝的字节数n，那么程序将发生缓冲区溢出；

（2）如果dest是高地址，src是低地址，拷贝可能发生错误，即源地址和目的地址重合部分在拷贝时被修改。

综上所述：memcpy参数较为简单，没有对程序安全性做进一步限制，将导致某些致命错误。

二 safe_memcpy

1.原型：

bool safe_memcpy(void *dst, const void *src, size_t len, const void *start, const void *end);
// dst指向目的地址
// src指向源地址
// len是待拷贝的字节数
// start指向目的地址开始地址
// end指向目的地址结束地址 即最后一个元素的后一个地址

2.实现分析：

safe_memcpy.hpp

#pragma once
#include <stdint.h>
#include <string.h>
static inl

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

I am 006!

关注关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【C语言】库函数常见的陷阱与缺陷(四)：内存内容操作函数[2]--memcpy

byte轻骑兵的技术小窝

12-15

399

memcpy是C语言标准库中的一个非常常用的函数，用于从源内存区域复制数据到目标内存区域。尽管它非常高效且易于使用，但在实际编程中，memcpy常常存在一些陷阱和缺陷，如果不小心处理，可能会导致严重的错误，比如缓冲区溢出、内存泄漏等。以下是一些常见的陷阱和缺陷，以及相应的防范措施：

【C语言进阶】使用memcpy你需要注意的一个问题

一个专注于嵌入式IoT领域的架构师，深耕IoT领域多年，深度掌握IoT领域的相关技术栈，包括但不限于RTOS内核的实现及其移植、硬件驱动移植开发、网络通讯协议开发、编译构建原理及其实现、底层汇编及编译原理、编译优化及代码重构、嵌入式IoT系统的架构设计等。

12-10

9328

日常编程中，memcpy可以算得上是使用频次非常高的函数，那么有些小点可能你没有关注到，本文将给你提个小醒。

2 条评论您还未登录，请先登录后发表或查看评论

2 条评论

会fei的猪 2021.06.17
按照文章代码，遇到点bug方便加您微信交流下吗
- I am 006!回复会fei的猪 2021.06.19
  2363702560

【安全函数】memcpy_s ()：C 语言内存复制的安全升级与 memcpy 深度对比

byte轻骑兵的技术小窝

09-11

8385

在 C 语言开发中，内存操作的安全性直接关系到程序的稳定性与安全性。memcpy () 作为经典的内存复制函数，虽高效却缺乏必要的安全检查，成为缓冲区溢出等漏洞的常见源头。C11 标准引入的 memcpy_s () 函数，在保留核心功能的基础上，通过全面的安全机制重构了内存复制逻辑。

memcpy_s这类安全函数使用介绍(来自安全 C 库: Safe C Library )

最新发布

LiteCode的博客

10-29

778

深入解析C语言memcpy与memmove区别，揭示内存操作的安全隐患与性能取舍。涵盖重叠内存处理机制、适用场景及效率对比，帮助开发者正确选择。掌握底层原理，提升代码稳定性，值得收藏。

安全函数strcpy_s、strncpy_s、snprintf_s、memcpy_s

11-01

用于了解安全函数strcpy_s、strncpy_s、snprintf_s、memcpy_s

实用经验 54 请务必小心使用memcpy()系列函数

一鸣惊人的博客

07-29

1250

在C语言中，无论是内置数据类型、还是自定义数据类型都是POD对象。对于POD对象其内存模型都是可知的、透明的。针对POD对象，其二进制内容是可以随便复制的，在任何地方，只要其二进制内容在，就能还原出正确无误的POD对象。C++中的对象可能是POD的也可能是非POD的。因此在C++中使用memset和memcpy等函数要足够小心。

关于memcpy函数安全性的一些讨论

Solititude的博客

11-29

2284

关于memcpy函数安全性的一些讨论

memcpy函数

weixin_38931060的博客

06-23

916

memcpy函数

001_安全函数_C_safe_library

qq_47325567的博客

08-04

2649

这里我们对这个返回值一般不关心，因为我们主要是初始化内存块，获得返回值对于我们来说也并没有什么太大的用，是作为返回给系统进行校验的，这个有兴趣的可以去查询下关于size_t，errno_t, rsize_t类型的定义和含义，我们这里主要介绍函数功能和使用。返回一个整数，0表示复制成功，返回非0值代表复制不成功，不同的值表示不同的错误，具体内容可以查阅MSDN手册。返回一个整数，0表示复制成功，返回非0值代表复制不成功，不同的值表示不同的错误，具体内容可以查阅MSDN手册。

Linux DMA 内存拷贝与memcpy 速率比较

yizhiniu_xuyw的专栏

06-01

1603

驱动层代码： #include <linux/kernel.h> #include <linux/fs.h> #include <linux/init.h> #include <linux/module.h> #include <linux/device.h> #include <linux/cdev.h> #include <linux/dmaengine.h> #include <linux/wait.h&g..

memcpy缺陷探讨

coderlang

05-02

9940

前一篇文章描述了memcpy的实现方法，本文将探讨下memcpy运用中存在的缺陷，即memcpy不能拷贝目的地址（dest）和源地址（src）内存空间有重合的部分，更为确切的说应该是当目的地址大于源地址的时候，不能够有重合部分，否则源地址重合部分数据会发生错误以下分析只考虑目的地址和源地址有数据重合情况，在没有数据重合情况的时候，memcpy是能够正确的使用，不会出现错误 1、当目的地址（d

memcpy_s

m0_69871514的博客

08-07

2973

memcpy_s是一个安全版本的memcpy函数，它在标准 C 库中并不直接提供，但它是某些安全编码标准（如 Microsoft 的安全开发生命周期 SDL）推荐的函数，旨在减少缓冲区溢出的风险。这个函数的行为与memcpy类似，但它要求程序员明确指定目标缓冲区的大小，从而避免了由于缓冲区大小错误而导致的溢出。

memcpy函数及其缺陷分析

星空_MAX

04-14

3483

函数介绍函数原型 void *memcpy(void *destin, void *source, unsigned n); 参数 destin-- 指向用于存储复制内容的目标数组，类型强制转换为 void* 指针。 source-- 指向要复制的数据源，类型强制转换为 void* 指针。 n-- 要被复制的字节数。返回值该函数返回一个指向目标存储区destin的指针。注意该函数的结尾是以'\0'判断的缺陷分析之一：区域重叠问题画个图就

char 型字符串更加安全的拷贝函数 strlcpy 实现方式

Hello_Rainy的博客

10-01

894

strlcpy是一个类似strcpy的字符串拷贝函数，它的目的是保证拷贝过程中缓冲区不会溢出，并且最后缓冲区内是一个有效的C字符串。它的定义如下： size_t strlcpy(char * dest, const char * src, size_t size); 参数： char * dest目标缓冲区 const char * src原始字符串 size_t size目标缓冲区长...

c++下memcpy()、memset()、memcmp()需要注意的

weixin_30757793的博客

08-03

2343

memcpy()、memset()、memcmp()等这些内存操作函数经常会帮我们完成一些数据复制、赋值等操作。因为在C语言中，无论是内置类型，还是自定义的结构类型（struct），其内存模型对于我们来说都是可知的、透明的。所以，我们可以对该对象的底层字节序列一一进行操作，简单而有效。代码片段如下所示： structSTUDENT { char_name[32]; ...

memcpy_s 的安全提示

guilanl的专栏

04-25

5252

errno_t memcpy_s( void *restrict dest, rsize_t destsz, const void *restrict src, rsize_t count ); (2) (since C11) 1) Copies count characters from the

linux下实现memcpy_s函数

一个叫木头&一个叫马尾

08-13

9567

memcpy_s是windows下的一种安全内存操作函数，但是linux下并没有实现，在此自己实现一个类似功能的函数memcpy_st： int memcpy_st(void *det, size_t detSize, const void * src, size_t srcSize, char *cppName, uint32_t lineNumber) { uint8_t error...

memcpy（）

weixin_38276986的博客

12-02

2599

memcpy（） void *memcpy(void *str1, const void *str2, size_t n) 函数功能从存储区str2拷贝n个字符到存储区str1 返回值函数返回无类型指针，实际指向str1存储区参数 str1：指向存储区1 str2：指向存储区2 n：拷贝的字节数测试 #include<stdio.h> #include<string.h> int main(void) { char p[7] = "10000"; char q[

memcpy拷贝字符串c_str()

08-03

<think>我们讨论的是使用memcpy拷贝std::string的c_str()返回的字符串的行为。首先，c_str()返回一个指向以空字符('\0')结尾的字符数组的指针。这个数组包含了string对象当前存储的字符串内容（包括结尾的'\0'）。使用memcpy拷贝这个字符串是安全的，因为memcpy会复制指定字节数的数据，不关心数据内容（包括中间的'\0'）。但需要注意以下几点： 1. 拷贝的字节数：通常我们需要拷贝整个字符串（包括结尾的空字符），所以字节数应该是字符串长度+1（因为c_str()返回的字符串以'\0'结尾，所以长度是strlen(str)+1）。但是，如果我们知道目标缓冲区的大小，并且确保不会越界，那么就可以安全地使用memcpy。 2. 注意：c_str()返回的指针指向的数组是string对象内部维护的，这个数组的内容在string对象被修改或者销毁后可能会失效（例如，string重新分配内存或者被销毁）。因此，在拷贝之前要确保string对象不会被修改（比如在拷贝过程中，其他线程修改了该string），并且拷贝后如果需要长期使用，应该将拷贝的数据独立存储。 3. 示例代码：假设我们有一个string对象，我们想要将其内容（包括结尾的'\0'）复制到一个新的字符数组中。 4. 与strcpy或strncpy的区别： - strcpy会一直复制直到遇到源字符串中的第一个'\0'，然后自动添加一个'\0'（但要求源字符串必须有'\0'结尾，否则会越界）。 - strncpy会复制指定长度的字符，如果遇到源字符串中的'\0'，则后面用'\0'填充直到达到指定长度。但是，如果源字符串中没有'\0'，那么它不会在目标字符串的末尾添加'\0'。 - memcpy则完全按照指定的字节数复制，不关心内容，因此不会自动添加'\0'。所以，如果使用memcpy复制字符串，我们需要确保复制了结尾的'\0'（如果我们希望目标字符串是一个C风格字符串的话），并且目标缓冲区有足够的空间。 5. 因此，使用memcpy来复制c_str()返回的字符串，我们可以这样做： ```cpp #include <iostream> #include <cstring> #include <string> int main() { std::string s = "Hello, world!"; const char* cstr = s.c_str(); // 计算需要复制的字节数（包括结尾的'\0'） size_t len = s.size() + 1; // 因为c_str()返回的字符串长度是size()，再加上一个'\0' // 分配目标缓冲区 char* buffer = new char[len]; // 使用memcpy复制 memcpy(buffer, cstr, len); // 验证：现在buffer中包含的字符串和s相同，并且以'\0'结尾 std::cout << buffer << std::endl; delete[] buffer; return 0; } ``` 6. 注意事项： - 上述代码中，我们使用s.size()+1作为复制的字节数，因为c_str()返回的字符串长度是s.size()，再加上一个结尾的空字符，所以总共需要复制s.size()+1个字节。 - 这样复制后，buffer中的内容就是完整的C风格字符串，包括结尾的'\0'。 7. 引用参考： - 引用[3]提到：c_str()返回一个const char*指针，指向以空字符终止的数组。因此，我们可以安全地使用这个指针来复制整个字符串，包括结尾的空字符。 - 引用[4]中提到了在string的构造函数中使用memcpy而不是strcpy的原因：因为strcpy无法处理中间带有'\0'的字符串（如"hello\0world"），而memcpy可以。同样，如果我们的字符串中可能包含'\0'（即二进制数据），那么使用memcpy是合适的，因为我们可以指定复制的字节数。但是，注意，在这种情况下，c_str()返回的字符串在第一个'\0'处就被截断了（因为c_str()要求以空字符结尾，所以它返回的字符串只到第一个'\0'为止）。所以，如果string对象中包含嵌入的'\0'，那么c_str()返回的字符串只到第一个'\0'，而size()返回的长度是实际存储的字符数（包括嵌入的'\0'后面的字符，但c_str()返回的字符串中不会包含嵌入的'\0'后面的字符？）。实际上，std::string可以存储包含'\0'的字符串，但是当使用c_str()时，返回的字符串会在第一个'\0'处被截断吗？不是的，std::string存储的是二进制安全的数据，它允许嵌入'\0'，并且c_str()返回的字符串会包含整个字符串（包括嵌入的'\0'）以及最后添加的结尾'\0'。例如： ```cpp std::string s = "abc\0def"; // 注意：这里用字符串字面量初始化，实际上s的大小是3，因为字符串字面量在第一个'\0'处结束 // 正确构造包含嵌入'\0'的string的方法： std::string s2("abc\0def", 7); // 使用字符数组和长度来构造 const char* p = s2.c_str(); // 此时p指向的字符串是"abc\0def\0"，其中第4个字符是'\0'，第8个字符是最后的'\0' ``` 但是，如果我们用`std::cout << s2;`输出，则只会输出"abc"，因为输出函数遇到第一个'\0'就停止。所以，如果我们想要完整复制整个字符串（包括嵌入的'\0'），那么使用memcpy(s2.c_str(), s2.size()+1)是正确的方式。总结：使用memcpy拷贝c_str()返回的字符串是安全的，只要： - 拷贝的字节数是string.size()+1（这样包括结尾的'\0'） - 确保在拷贝过程中，string对象没有被修改（因为c_str()返回的指针可能因string修改而失效） - 目标缓冲区足够大（至少string.size()+1字节）引用参考： [^3]: c_str()返回以空字符终止的数组。 [^4]: 使用memcpy而不是strcpy，因为可以处理中间有'\0'的情况。如果用户需要处理可能包含多个'\0'的字符串（二进制数据），那么使用memcpy是合适的，并且要配合size()来确定复制的长度。注意：当string对象被修改或销毁后，c_str()返回的指针就失效了，所以拷贝操作要在string对象有效且不变的情况下进行。相关问题： 1. 如何安全地拷贝包含嵌入空字符的std::string？ 2. 使用c_str()和data()有什么区别？ 3. memcpy和strcpy在处理字符串时有哪些不同？</think>使用`memcpy`拷贝`std::string::c_str()`返回的字符串是**安全且高效**的行为，但需要特别注意以下关键点： ### 1. `c_str()`的特性与`memcpy`的适用性 - `c_str()`返回`const char*`指针，指向以`\0`结尾的字符数组（C风格字符串）[^3] - `memcpy`会**精确复制指定字节数**，不关心内容中的`\0`字符（与`strcpy`不同）[^2] ```cpp std::string s = "hello\0world"; // 包含嵌入的'\0' const char* cstr = s.c_str(); size_t len = s.size() + 1; // 包含结尾'\0' char buffer[20]; memcpy(buffer, cstr, len); // 安全复制所有字节（含嵌入的'\0'） ``` ### 2. 正确使用方式（必须三步） ```cpp std::string src = "二进制数据\0可能有空字符"; // 步骤1：获取指针和长度 const char* cstr = src.c_str(); size_t byte_count = src.size() + 1; // +1包含结尾'\0' // 步骤2：确保目标缓冲区足够大 char* dest = new char[byte_count]; // 分配足够空间 // 步骤3：执行拷贝 memcpy(dest, cstr, byte_count); // 复制完整数据 // 使用后释放内存 delete[] dest; ``` ### 3. 与`strcpy`的对比（关键区别） | 特性 | `memcpy` + `c_str()` | `strcpy`/`strncpy` | |---------------------|----------------------------------|--------------------------------| | 空字符处理 | 保留所有`\0` | 遇第一个`\0`停止 | | 二进制数据安全性 | ✅ 安全（如PNG/EXE文件） | ❌ 会截断数据 | | 性能 | ⚡️ 更高（无终止符检查） | ⚠️ 需扫描字符串 | | 长度控制 | 精确字节控制 | 依赖遇`\0`停止或补`\0`[^2] | ### 4. 典型应用场景 1. **处理嵌入空字符的字符串** ```cpp // 从文件读取二进制数据 std::string bin_data = read_binary_file("image.png"); memcpy(dest, bin_data.c_str(), bin_data.size() + 1); ``` 2. **与C API交互** ```cpp // 传递到C库函数 void c_lib_func(const char* data, size_t len); c_lib_func(s.c_str(), s.size() + 1); // 需显式传递长度 ``` 3. **避免`std::string`的浅拷贝问题** ```cpp struct SafeData { char* buffer; size_t size; SafeData(const std::string& s) : size(s.size() + 1), buffer(new char[size]) { memcpy(buffer, s.c_str(), size); // 深拷贝 } ~SafeData() { delete[] buffer; } // 安全释放 }; ``` ### 5. 必须遵守的注意事项 1. **生命周期管理** `c_str()`指针在以下情况失效： - 修改原`std::string`对象 - `std::string`被析构 ```cpp const char* unsafe() { std::string tmp = "危险!"; return tmp.c_str(); // ❌ 返回悬垂指针 } ``` 2. **缓冲区溢出防护** 始终验证目标空间： ```cpp void safe_copy(char* dest, size_t dest_size, const std::string& src) { size_t req_size = src.size() + 1; if(dest_size < req_size) { throw std::runtime_error("缓冲区不足"); } memcpy(dest, src.c_str(), req_size); } ``` 3. **优先用`data()`（C++17起）** C++17后`data()`也返回以`\0`结尾的字符串[^3]： ```cpp memcpy(dest, s.data(), s.size() + 1); // C++17起安全 ``` ### 6. 错误使用示例 ```cpp // 错误1：未分配足够空间 char buf[5]; std::string s = "hello"; memcpy(buf, s.c_str(), s.size() + 1); // ❌ 缓冲区溢出 // 错误2：忽略结尾'\0' char* p = new char[s.size()]; // 少1字节 memcpy(p, s.c_str(), s.size()); // ❌ 结尾无'\0' p[s.size()] = '\0'; // 访问越界 ``` > **最佳实践**：当需要处理可能包含`\0`的二进制数据或要求高性能时，`memcpy` + `c_str()`是理想选择。但必须严格管理内存生命周期和缓冲区边界[^3][^4]。 ---