可执行文件的装载于进程

6.1  进程虚拟地址空间
      每个程序运行起来以后,它将拥有自己独立的虚拟地址空间,这个虚拟地址空间的大小由计算机的硬件平台决定,具体来说是由CPU的位数决定的


    对于windows来说,它的进程虚拟地址空间划分是操作系统占用2GB,那么进程就只剩2GB空间。
    windows有个启动参数可以将操作系统占用的虚拟地址空间减少到1GB,即跟Linux分布一样。方法如下:
       修改windows系统盘根目录下的Boot.ini,加上“/3G”参数


      [boot loader]
timeout=30
default=multi(0)disk(0)rdisk(0)partition(1)\WINDOWS
[operating systems]
multi(0)disk(0)rdisk(0)partition(1)\WINDOWS="Microsoft Windows XP Professional" /3G /noexecute=optin /fastdetect


AWE(Windows):
   操作系统提供一种窗口映射的方式使用那些大于常规的内存空间


   Linux 等Unix类操作系统用mmap()系统调用来实现


6.2   装载的方式
        动态装载:
             程序运行时是有局部性原理的,可以将程序最常用的部分驻留在内存中,而将一些不太常用的数据存放在磁盘上,这就是动态装载的基本原理
         覆盖装入和页映射是两种很典型的动态装载方法


         覆盖管理器需要保证两点:
              1)、树状结构从任何一个模块到树的根模块都叫做调用路径
              2)、禁止跨树间调用,任何一个模块不允许跨过树状结构进行调用


       页映射是虚拟存储机制的一部分




6.4  可执行文件的装载
      进程的建立
         从操作系统的角度看,一个进程最关键的特征是它拥有独立的虚拟地址空间,这使得它有别于其他进程


     创建一个进程,然后装载相应的可执行文件并且执行,在有虚拟存储的情况下:
         1) 创建一个独立的虚拟地址空间
         2) 读取可执行文件头,并且建立虚拟空间与可执行文件的映射关系
         3) 将CPU的指令寄存器设置成可执行文件的入口地址,启动运行


      创建虚拟地址空间
         创建一个虚拟地址空间实际上并不是创建空间而是创建映射函数所需要的相应的数据结构,在Linux下,创建虚拟地址空间实际上只是分配一个页目录就可以了


      读取可执行文件头,并且建立虚拟空间与可执行文件的映射关系
          当操作系统捕获到缺页错误时,它应知道程序当前所需要的页在可执行程序的哪一个位置,这就是虚拟空间与可执行文件之间的映射关系


           由于可执行文件在装载时实际上被映射到虚拟空间,所以可执行文件很多时候也被称为“映射文件”


      Linux 中将进程虚拟空间中的一个段叫做虚拟内存区域(VMA)  windows中将整个叫做虚拟段


      将CPU指令寄存器设置成可执行文件的入口,启动运行
          操作系统通过设置CPU的指令寄存器将控制权转交给进程,由此进程开始执行。从进程的角度而言,操作系统执行了一条跳转指令,直接跳转到可执行文件的入口地址




6.5  进程虚拟内存空间分布
      ELF可执行文件引入了一个概念叫做“Segment”,一个“Segment”包含一个或多个属性类似的“Section”     这样做的好处就是很明显地可以减少页面内存碎片


6.6  堆和栈
      操作系统通过使用VMA来对进程地址的空间进行管理,进程在执行他们的时候还需要用到栈、堆等空间


     匿名虚拟内存区域(VMA): 三个段的文件所在的主设备号和次设备号及文件节点号都是0,则表示它们没有映射到文件中。


    一个进程基本上可以分为如下几种VMA区域:
        代码VMA,数据VMA,堆VMA,栈VMA


6.7  堆得最大申请数量
       使用下面的程序能够检测malloc最大内存申请数量:
        #include <stdio.h>
#include <stdlib.h>


unsigned maximum = 0;


int main(int argc, char *argv[])
{
    unsigned blocksize[] = { 1024*1024,1024,1};
    int i,count;
    for(i = 0;i < 3; i++)
       for(count = 1;;count++)
          {
             void *block = malloc(maximum + blocksize[i]*count);
             if(block)
             {
                 maximum = maximum + blocksize[i]*count;
                 free(block);
             }
             else
             {
                 break;
             }
          }
    printf("maximum malloc size = %u bytes\n",maximum);
}


在Linux机器上结果大概是2.9GB左右,在windows上大概是1.5GB


6.8  进程栈初始化
     进程刚启动的时候,最基本的就是系统环境变量和进程的运行参数
      进程在启动以后,程序的库部分会把堆栈里的初始化信息中的参数信息传递给main()函数,也就是我们熟知的main()函数的两个argc和argv参数,这两个参数分别对应着这里的命令行参数数量和命令行参数字符串的指针数组


6.9  Linux内核装载ELF过程简介
    bash进程会调用fork()系统调用创建一个新的进程,然后新的进程调用execve()系统调用执行指定的ELF文件,原先的bash进程继续返回等待刚才启动的新进程结束


    每种可执行文件的格式的开头几个字节都是很特殊的,特别是开头的4个字节,常常被称为魔数,通过对魔数的判断可以确定文件的格式和类型


    ELF的头4个字节为0x7F、'e’,'l'、'f'         Java的可执行文件的头4个字节为'c','a','f','e'


    shell、perl、python等解释型脚本语言,第一行往往是"#!/bin/sh"、“#!/usr/bin/perl”或“#!/usr/bin/python”这个时候前面2个字节“#”和“!”就构成了魔数,系统解析到这2个字节,就对后面的字符串进行解析,以确定具体的解释程序的路径


   主要步骤是:
     1)、检查ELF可执行文件格式的有效性,比如魔数、程序头表中段(Segment)的数量
     2)、寻找动态链接的“.interp”段,设置动态链接器的路径
     3)、根据ELF可执行文件的程序头表的描述,对ELF文件进行映射,
     4)、初始化ELF进程环境,比如进程启动时EDX寄存器的地址应该是DT_FINI的地址
     5)、将系统调用的返回地址修改成ELF可执行文件的入口地址




6.10  Windows PE的装载
    RVA 表示相对虚拟地址,相对于PE文件的装载基地址的偏移地址,每一个PE文件装载的时候都会有一个装载目标地址,这就是基地址
 
    装载PE可执行文件:
      1)、读取文件的第一个页,该页包含了DOS头,PE头和段表
      2)、检查进程地址空间中,目标地址是否可用,如果不可用,则另外选一个装载地址
      3)、使用段表中提供的信息,将PE文件中所有的段一一映射到地址空间中相应的位置
      4)、如果装载的不是目标位置,则进行Rebasing
      5)、装在所有PE文件所需要的DLL文件
      6)、对PE文件中的所有导入符号进行解析
      7)、根据PE头中指定的参数,建立初始化栈和堆
      8)、建立主线程并且启动进程
<think>我们正在详细讨论可执行文件装载过程,特别是ELF文件的加载、内存映射和动态链接库处理。根据用户提供的引用和之前的问题,我们需要整合信息,构建一个详细的装载过程解析。 关键点: 1. 触发装载:用户执行程序(如./program)触发execve系统调用。 2. 打开并验证文件:操作系统打开文件,检查ELF魔数(0x7f 45 4C 46)等。 3. 解析ELF文件头:获取入口点、程序头表(Program Header Table)位置和大小、动态链接器路径等。 4. 创建进程地址空间:释放旧地址空间(如果是替换当前进程),创建新的虚拟地址空间,初始化页表。 5. 加载段到内存:根据程序头表将各个段(如.text, .data)映射到内存,处理.bss段(清零)。 6. 动态链接处理:如果存在动态链接,加载动态链接器(如ld-linux.so),并执行重定位和初始化。 特别关注引用[1]中提到的load_elf_binary函数(Linux内核中处理ELF装载的核心函数),引用[2]中关于装载流程的步骤,引用[4]中关于段(segment)映射虚拟内存区域(VMA)的描述。 我们将按照以下结构组织回答: - 触发装载 - ELF文件验证 - 解析ELF文件头 - 创建新地址空间 - 加载段到内存(内存映射) - 动态链接处理 - 设置程序入口 同时,我们将使用Mermaid图表来展示内存映射的布局,并给出一个装载过程的代码级概述(以Linux内核的load_elf_binary为例)。 注意:由于用户要求详细,我们会深入解释每个步骤,但避免过于底层的内核细节,专注于ELF装载相关部分。</think># 可执行文件装载过程详解 ## 一、触发装载 当用户执行`./program`或通过图形界面启动程序时: 1. Shell解析命令并调用`fork()`创建新进程 2. 新进程通过`execve()`系统调用请求内核装载可执行文件 3. 内核验证文件权限和类型后开始装载流程[^2] ```c // Linux内核execve系统调用入口 SYSCALL_DEFINE3(execve, ...) { return do_execve(getname(filename), ...); } ``` ## 二、ELF文件验证与解析 内核通过`load_elf_binary`函数处理装载过程: ### 1. 文件头验证 ```c // 内核源码片段 fs/binfmt_elf.c static int load_elf_binary(struct linux_binprm *bprm) { // 读取ELF前128字节 loc->elf_ex = *((struct elfhdr *)bprm->buf); // 验证魔数 0x7F+'E'+'L'+'F' if (memcmp(elf_ex.e_ident, ELFMAG, SELFMAG) != 0) goto out; } ``` 验证通过后继续解析关键字段[^1][^3]: | 字段 | 描述 | 作用 | |------|------|------| | e_entry | 程序入口地址 | 设置程序计数器 | | e_phoff | 程序头表偏移 | 定位段信息 | | e_phnum | 程序头数量 | 确定段数量 | ### 2. 程序头表解析 程序头表(Program Header Table)描述**内存段**信息: ```c struct elf32_phdr { Elf32_Word p_type; // 段类型 (LOAD, DYNAMIC等) Elf32_Off p_offset; // 文件内偏移 Elf32_Addr p_vaddr; // 虚拟地址 Elf32_Word p_filesz; // 文件内大小 Elf32_Word p_memsz; // 内存中大小 Elf32_Word p_flags; // 权限标志 (R/W/X) }; ``` 关键段类型: - `PT_LOAD`:需装载的段(代码/数据) - `PT_DYNAMIC`:动态链接信息 - `PT_INTERP`:动态链接器路径 ## 三、内存映射与地址空间创建 ### 1. 创建新地址空间 ```c // 释放旧地址空间 flush_old_exec(bprm); // 创建新页表 current->mm->pgd = pgd_alloc(mm); ``` 进程虚拟地址空间布局初始化: ```mermaid graph TD A[0x00000000] --> B[保留区] B --> C[.text段] C --> D[.data段] D --> E[.bss段] E --> F[堆] F --> G[共享库] G --> H[栈] H --> I[内核空间] ``` ### 2. 段装载与内存映射 对每个`PT_LOAD`类型段执行: ```c // 计算对齐后的内存大小 unsigned long size = ELF_PAGEOFFSET(phdr->p_vaddr) + phdr->p_filesz; // 建立文件到内存的映射 error = vm_mmap(bprm->file, phdr->p_vaddr & PAGE_MASK, size, prot, MAP_FIXED|MAP_PRIVATE, phdr->p_offset); ``` 映射特点[^4]: - 使用**写时复制**(Copy-On-Write)技术 - .bss段映射为匿名页(初始化为0) - 只读段共享物理页(如多个进程运行同一程序) ## 四、动态链接处理 ### 1. 动态链接器加载 若存在`PT_INTERP`段: ```c // 读取动态链接器路径(如/lib64/ld-linux-x86-64.so.2) elf_interpreter = kmalloc(elf_ppnt->p_filesz, GFP_KERNEL); // 装载动态链接器 load_elf_interp(&loc->interp_elf_ex, interpreter, &interp_load_addr); ``` ### 2. 重定位与符号解析 动态链接器执行: 1. 装载所有依赖库(`.so`文件) 2. 解析符号引用(通过`.dynsym`和`.dynstr`节) 3. 重定位全局偏移表(GOT): ```c // GOT表项重定位示例 *got_entry = symbol_address; ``` 4. 延迟绑定(Lazy Binding):通过PLT实现函数首次调用时解析 ### 3. 初始化执行 动态链接器完成后的操作: ```c // 设置入口地址 start_thread(regs, elf_entry, bprm->p); // 跳转到程序入口(通常为_start) regs->ip = elf_entry; ``` ## 五、完整装载流程 ```mermaid sequenceDiagram participant User participant Kernel participant Linker participant Memory User->>Kernel: execve("./program") Kernel->>Kernel: 验证ELF魔数 Kernel->>Kernel: 解析程序头表 Kernel->>Memory: 创建虚拟地址空间 loop 每个PT_LOAD段 Kernel->>Memory: 建立文件-内存映射 end alt 存在PT_INTERP Kernel->>Linker: 加载动态链接器 Linker->>Linker: 装载依赖库 Linker->>Memory: 重定位GOT/PLT end Kernel->>User: 返回用户态执行 ``` ## 六、关键数据结构 Linux装载过程核心数据结构: ```c struct linux_binfmt { // 可执行文件格式处理 struct list_head lh; int (*load_binary)(struct linux_binprm *); }; struct elf_phdr { // 程序头 Elf32_Word p_type; Elf32_Off p_offset; Elf32_Addr p_vaddr; Elf32_Word p_filesz; Elf32_Word p_memsz; Elf32_Word p_flags; }; struct mm_struct { // 内存描述符 pgd_t * pgd; // 页全局目录 unsigned long start_code, end_code; // 代码段范围 unsigned long start_data, end_data; // 数据段范围 unsigned long start_brk, brk; // 堆范围 unsigned long start_stack; // 栈起始 }; ``` ## 七、特殊场景处理 1. **位置无关代码(PIC)** - 共享库使用`-fPIC`编译 - 通过GOT实现地址无关访问 2. **ASLR(地址空间随机化)** ```c // 内核随机化加载地址 if (current->flags & PF_RANDOMIZE) load_bias += arch_mmap_rnd(); ``` 3. **大页支持** 使用`MAP_HUGETLB`标志映射2MB/1GB大页 ## 总结 可执行文件装载过程是操作系统核心功能: 1. 通过**内存映射**技术高效加载代码/数据段 2. **动态链接**实现库共享和延迟绑定 3. **虚拟地址空间**隔离保障进程安全 4. **写时复制**优化内存使用效率 理解装载机制对性能优化、安全加固(如ASLR)和容器技术(namespace隔离)有重要意义[^1][^4]。 --- ## 相关问题 1. 动态链接器(ld-linux)的具体工作流程是怎样的? 2. 如何查看进程的内存映射布局(使用/proc/<pid>/maps)? 3. 全局偏移表(GOT)和过程链接表(PLT)如何协同实现延迟绑定? 4. 位置无关代码(PIC)的实现原理及其在安全中的应用? 5. 容器技术(如Docker)如何利用命名空间修改装载行为? [^1]: ELF文件装载的核心函数是`load_elf_binary`,负责解析文件头和程序头表 [^2]: 可执行文件装载过程包括文件验证、地址空间创建和段映射 [^3]: ELF文件格式通过程序头表描述内存段信息 [^4]: 可执行文件通过匿名虚拟内存区域(VMA)映射进程地址空间
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值