关于内存映射文件技术处理大文件的读写

最新推荐文章于 2025-10-16 10:13:34 发布

原创

最新推荐文章于 2025-10-16 10:13:34 发布 · 8.6k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#null #string #file #iostream #正则表达式 #windows

本文探讨了在Windows环境下，面对大文件（如几十M到几G）时，传统读写方法的局限性，并介绍了内存映射文件技术（Mapping File）以解决内存、CPU利用率和IO瓶颈问题。通过示例展示了如何使用内存映射文件进行大文件的快速读取和写入，以提高文件处理效率。

Windows对文件的读写提供了很丰富的操作手段，如:
1. FILE *fp, fstearm...; (C/C++)
2. CFile, CStdioFile...; (MFC)
3. CreateFile, ReadFile...;(API)
...

在处理一般的文件(文本/非文本),这些足够了。然而在处理比较大的文件如
几十M, 几百M, 甚至上G的文件, 这时再用一般手段处理，系统就显的力不从心了

要把文件读出，再写进，耗费的是CPU利用率与内存以及IO的频繁操作。这显然是
令用户难以忍受的

为了解决这个吃内存，占CPU，以及IO瓶颈，windows核心编程提供了内存映射文件技术
(Maping File)

至于Maping File是什么原理，我不多说了，网上转载资源一箩筐，我只想从应用层
来考虑，怎样用这个技术，实现日常项目中的应用
举例来说:
可能项目中，会经常用到一些大量的常量，而这些大量常量用宏来替代写再源文件中
显然不可取，一般是写在文件中，给常量一些编号，通过编号来索引

一般文件比较小时候，常用做法也是先预读到内存中，毕竟从内存中读比从文件中读要快(IO操作的瓶颈)
比较好的做法，读到STL MAP 中去:
例如一个索引文件:
SEU07201213=汪洋中的一片叶子
JIANGSHENG=蒋晟
SEU07201214=优快云
............
打开文件，解析=号，在解析方面有CString操作,strtok,strstr, boost 正则表达式匹配等等，但我比较喜欢
sscanf(szIndex, "[%^=]=[%^=]", sName, sValue);
sscanf(szIndex, "[%^=]=%s", sName, sValue);
fscanf(stream, "[%^=]=[%^=]", sName, sValue);
之类,
然后再定义一个map:
map<string, string> m_Map;
m_Map[sName] = sValue;

但是文件比较大的时候，笔者做过测试，用上面方法处理一个15M, 25万行的文本文件，占用内存非常
的高，达70多M,处理的速度也非常的慢，这还不包括回写到文件
这时，Maping File就派上用场了，这里处理大文件就抛弃了map的应用(因为容器占用很多内存)
而是直接利用字符指针来操作，不用其他封装，不多说了，请看示例:

#pragma warning(disable: 4786)

#include < windows.h >

#include < stdio.h >

#include < iostream >

#include < string >

using namespace std;

string GetValue( const TCHAR * , const TCHAR * ); // 根据name得value

void main( int argc, char *

最低0.47元/天解锁文章

12 条评论

dlmult 2010.09.15
[e01] 学习学习。

wwei466 2008.11.20
不好意思，网速太慢。还以为没传上。
- dlmult回复wwei466 2010.09.15
  回复 wwei466：关注，关注。

wwei466 2008.11.20
这个主要是用到了修改已知项，那么如果我需要读取每一行，并对其进行快速的分析验证，需要怎么做？

wwei466 2008.11.20
这个主要是用到了修改已知项，那么如果我需要读取每一行，并对其进行快速的分析验证，需要怎么做？

wwei466 2008.11.20
这个主要是用到了修改已知项，那么如果我需要读取每一行，并对其进行快速的分析验证，需要怎么做？

wwei466 2008.11.20
这个主要是用到了修改已知项，那么如果我需要读取每一行，并对其进行快速的分析验证，需要怎么做？

wwei466 2008.11.20
这个主要是用到了修改已知项，那么如果我需要读取每一行，并对其进行快速的分析验证，需要怎么做？

Liusha 2007.09.17
最近正在用到内存映射文件，内容已经可以读取到，但是怎么将lpbMapAddress中的内容显示成类似ULTRAEDIT一样的效果呢？请教！

赖勇浩 2006.12.03
是%[^=]吧？

seu07201213(【卐】〖︻╋█████████◤ 〗 2006.09.03
恩，阅读挺仔细，笔误已修正，欢迎指正 (≈^︵^≈)