内存偏移(RVA)与文件偏移(offset)相互转换

本文提供了一种实用的方法来实现PE文件中内存偏移与文件偏移之间的转换,并附带了详细的C语言代码示例。
写此文源于前一阵写一个PE修改工具,需要用到内存偏移向文件偏移转化。想着这种简单的代码网上应该一大把,百度了一下,没找到。又google,又没找到,可能是自己搜索的功力太不到家了。着急用,只好自己写了一个函数用来转换。相信很多人做PE开发的时候都会有这个需求,把这个函数贴出来供大家参考,大牛莫耻笑。
原理比较简单:首先判断这个地址是否在PE头中,如果在,文件偏移和内存偏移相等,如果存在于文件的区段中,则利用以下公式:
内存偏移 - 该段起始的RVA(VirtualAddress) = 文件偏移 - 该段的PointerToRawData
内存偏移 = 该段起始的RVA(VirtualAddress) + (文件偏移 - 该段的PointerToRawData)
文件偏移 = 该段的PointerToRawData + (内存偏移 - 该段起始的RVA(VirtualAddress))

代码如下:
01.#include <stdio.h>  
02./* 
03.Purpose:PE文件的内存偏移与文件偏移相互转换,不考虑系统为对齐填充偏移转换 
04.szFileName:文件名 
05.dwAddr:需要转换的偏移值 
06.bFile2RVA:是否是文件偏移到内存偏移的转换,1 - dwAddr代表的是文件偏移,此函数返回内存偏移 
07.      0 - dwAddr代表的是内存偏移,此函数返回文件偏移 
08.返回值:相对应的偏移值,失败返回-1 
09.*/  
10.  
11.DWORD AddressConvert(char szFileName[], DWORD dwAddr, BOOL bFile2RVA)  
12.{  
13.  char *lpBase = NULL;  
14.  DWORD dwRet = -1;  
15.  //1.首先将文件读入内存  
16.  if(szFileName[0] == 0)  
17.  {  
18.    return -1;  
19.  }  
20.  
21.  FILE *fp = fopen(szFileName, "rb");  
22.  if(fp == 0)  
23.  {  
24.    return -1;  
25.  }  
26.  
27.  fseek(fp, 0, SEEK_END);  
28.  DWORD dwFileSize = ftell(fp);  
29.  if(dwFileSize == 0)  
30.  {  
31.    return -1;  
32.  }  
33.  
34.  lpBase = new char[dwFileSize];  
35.  memset(lpBase, 0, dwFileSize);  
36.  fseek(fp, 0, SEEK_SET);  
37.  fread(lpBase, 1, dwFileSize, fp);  
38.  fclose(fp);  
39.  
40.  //2.读取该文件的信息(文件内存对齐方式以及区块数量,并将区块表指针指向区块表第一个区块头)  
41.  PIMAGE_DOS_HEADER pDosHeader = (PIMAGE_DOS_HEADER)lpBase;  
42.  PIMAGE_NT_HEADERS pNtHeader = (PIMAGE_NT_HEADERS)((unsigned long)lpBase + pDosHeader->e_lfanew);  
43.    
44.  DWORD dwMemAlign = pNtHeader->OptionalHeader.SectionAlignment;  
45.  DWORD dwFileAlign = pNtHeader->OptionalHeader.FileAlignment;  
46.  int dwSecNum = pNtHeader->FileHeader.NumberOfSections;  
47.  PIMAGE_SECTION_HEADER pSecHeader = (PIMAGE_SECTION_HEADER)((char *)lpBase + pDosHeader->e_lfanew + sizeof(IMAGE_NT_HEADERS));  
48.  DWORD dwHeaderSize = 0;  
49.    
50.  if(!bFile2RVA)  // 内存偏移转换为文件偏移  
51.  {    
52.    //看需要转移的偏移是否在PE头内,如果在则两个偏移相同  
53.    dwHeaderSize = pNtHeader->OptionalHeader.SizeOfHeaders;  
54.    if(dwAddr <= dwHeaderSize)  
55.    {  
56.      delete lpBase;  
57.      lpBase = NULL;  
58.      return dwAddr;  
59.    }  
60.    else //不再PE头里,查看该地址在哪个区块中  
61.    {  
62.      for(int i = 0; i < dwSecNum; i++)  
63.      {  
64.        DWORD dwSecSize = pSecHeader[i].Misc.VirtualSize;  
65.        if((dwAddr >= pSecHeader[i].VirtualAddress) && (dwAddr <= pSecHeader[i].VirtualAddress + dwSecSize))  
66.        {  
67.          //3.找到该该偏移,则文件偏移 = 该区块的文件偏移 + (该偏移 - 该区块的内存偏移)  
68.          dwRet = pSecHeader[i].PointerToRawData + dwAddr - pSecHeader[i].VirtualAddress;  
69.        }  
70.      }  
71.    }  
72.  }  
73.  else // 文件偏移转换为内存偏移  
74.  {  
75.    dwHeaderSize = pNtHeader->OptionalHeader.SizeOfHeaders;  
76.    //看需要转移的偏移是否在PE头内,如果在则两个偏移相同  
77.    if(dwAddr <= dwHeaderSize)  
78.    {  
79.      delete lpBase;  
80.      lpBase = NULL;  
81.      return dwAddr;  
82.    }  
83.    else//不再PE头里,查看该地址在哪个区块中  
84.    {  
85.      for(int i = 0; i < dwSecNum; i++)  
86.      {  
87.        DWORD dwSecSize = pSecHeader[i].Misc.VirtualSize;  
88.        if((dwAddr >= pSecHeader[i].PointerToRawData) && (dwAddr <= pSecHeader[i].PointerToRawData + dwSecSize))  
89.        {  
90.          //3.找到该该偏移,则内存偏移 = 该区块的内存偏移 + (该偏移 - 该区块的文件偏移)  
91.          dwRet = pSecHeader[i].VirtualAddress + dwAddr - pSecHeader[i].PointerToRawData;  
92.        }  
93.      }  
94.    }  
95.  }  
96.    
97.  //5.释放内存  
98.  delete lpBase;  
99.  lpBase = NULL;  
100.  return dwRet;  
101.}   

### PE文件格式的关键结构字段解析 #### 1. 文件偏移地址 (Raw Address) 和虚拟内存地址 (RVA, Relative Virtual Address) 在PE文件中,存在两种类型的地址表示方法: - **原始存储地址(物理地址/文件偏移地址)** 是指相对于PE文件起始位置的偏移量。该地址主要用于描述文件在磁盘上的实际存储位置[^1]。 - **相对虚拟地址(RVA)** 则是指当PE文件被加载到内存后,相对于内存映像基址的偏移量。此地址用于运行时定位资源、代码和其他数据项[^1]。 两者之间的关系可以通过以下公式计算: ```plaintext VirtualAddress = FileOffset + ImageBase - SectionAlignment FileOffset = RVA - SectionHeader.VirtualAddress + SectionHeader.PointerToRawData ``` 其中 `ImageBase` 表示进程加载到内存后的基址;`SectionAlignment` 表示节对齐大小;`PointerToRawData` 和 `VirtualAddress` 来自于节表中的对应字段[^4]。 --- #### 2. 关键结构及其字段详解 ##### (1)DOS Header (`IMAGE_DOS_HEADER`) 这是PE文件的第一个结构,位于文件开头。它的主要作用是兼容旧版MS-DOS系统并引导至真正的PE头部。重要字段如下: - `e_magic`: DOS头标志符,固定值为 `"MZ"`。 - `e_lfanew`: 指向PE签名的位置(即文件偏移地址)。通过这一字段可以找到后续的NT Headers起点[^2]。 ##### (2)PE Signature 紧跟在DOS Header之后的是PE签名,由四个字节组成,通常为字符串 `"PE\0\0"`。它是确认文件是否遵循PE标准的重要标记。 ##### (3)NT Headers (`IMAGE_NT_HEADERS`) 及 Optional Header NT Headers包含了两个子部分——文件头和可选头。以下是关键字段说明: - **Signature**: 如前所述,固定的PE标识。 - **FileHeader**: - `Machine`: 描述目标CPU架构(如x86或AMD64)。 - `NumberOfSections`: 定义节数目。 - `SizeOfOptionalHeader`: 显示可选头的实际长度。 - **OptionalHeader**: - `Magic`: 标识PE文件版本(通常是`0x10B`代表PE32,或者`0x20B`代表PE32+)。 - `AddressOfEntryPoint`: 进程入口点的RVA值。 - `ImageBase`: 加载器尝试分配给模块的基础地址。 - `SectionAlignment`: 决定各节在内存中的对齐方式。 - `FileAlignment`: 控制各节在磁盘文件内的对齐规则[^2]。 ##### (4)Section Table (节表) 节表记录了各个区段的信息,包括名称、大小、权限等属性。每一项都包含以下几个核心字段: - `Name`: 区段名,最多八个字符。 - `Misc_VirtualSize`: 当前区段占用的虚拟内存大小。 - `VirtualAddress`: 此区段第一个字节对应的RVA。 - `SizeOfRawData`: 实际写入文件的数据块尺寸。 - `PointerToRawData`: 数据块在文件中的起始偏移量。 - `Characteristics`: 描述区段特性(例如只读、可执行等)[^3]。 --- #### 3. 示例代码展示如何获取特定字段 下面是一个简单的Python脚本片段,演示如何提取PE文件的部分元信息: ```python import pefile def analyze_pe(file_path): pe = pefile.PE(file_path) # 获取DOS头信息 dos_header_e_magic = hex(pe.DOS_HEADER.e_magic)[^2] dos_header_e_lfanew = hex(pe.DOS_HEADER.e_lfanew)[^2] # 获取NT头信息 nt_signature = hex(pe.NT_HEADERS.Signature)[^2] file_header_machine = hex(pe.FILE_HEADER.Machine) optional_header_address_of_entry_point = hex(pe.OPTIONAL_HEADER.AddressOfEntryPoint)[^2] # 获取首个区段信息 section_name = pe.sections[0].Name.decode().rstrip('\x00')[^3] virtual_address = hex(pe.sections[0].VirtualAddress)[^3] pointer_to_raw_data = hex(pe.sections[0].PointerToRawData)[^3] result = { "dos_header": {"e_magic": dos_header_e_magic, "e_lfanew": dos_header_e_lfanew}, "nt_headers": {"signature": nt_signature, "machine": file_header_machine, "entry_point": optional_header_address_of_entry_point}, "section_info": {"name": section_name, "virtual_address": virtual_address, "raw_pointer": pointer_to_raw_data} } return result file_analysis = analyze_pe("example.exe") print(file_analysis) ``` ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值