#Linux下的可执行文件格式ELF
###前言
可执行文件的分类:
windows:PE(.exe .dll .lib)
linux:ELF(.out .so .a)
1 ELF文件结构(如图)
ELF head要在第一个存放,而Program Header table与Section Header则不一定要与上图一致。
Program header table标识了各种各样的段(segment)应该如何组织,拥有什么样的权限。给进程用的。
Section header table是用来组织ELF文件储存在磁盘上各个节(Section)的信息,是给ELF文件用的。
1.2 段和节
下面这张图生动的说明了段和节的关系
section在汇编中的作用是标识下面的一段内容是干嘛的。而segment则是在多个可重定向文件要整合成一个可执行文件时,连接器把目标文件中相同的section整合为一个segment,方便加载器的加载。
1.3 ELF的两个视图
其中的linking view便是在磁盘中的ELF(如上所说,磁盘中为section而不是segment,因为还没有经过链接),execution view便是内存中的ELF了。
下面的图形象的体现了两个视图的关系。
当我们在shell中执行$ ./elf时候,各种节便会经过连接器整合为段。
1.4 虚拟内存
虚拟内存是计算机系统内存管理的一种技术。它使得应用程序认为它拥有连续可用的内存(一个连续完整的地址空间),而实际上物理内存通常被分隔成多个内存碎片,还有部分暂时存储在外部磁盘存储器上,在需要时进行数据交换。与没有使用虚拟内存技术的系统相比,使用这种技术使得大型程序的编写变得更容易,对真正的物理内存(例如RAM)的使用也更有效率。此外,虚拟内存技术可以使多个进程共享同一个运行库,并通过分割不同进程的内存空间来提高系统的安全性。
1.虚拟内存用户空间每个进程一份
2.虚拟内存内核空间所有进程共享一份
3.虚拟内存mmap段中动态链接库仅在物理内纯中装载一份
1.5 进程虚拟地址空间
地址以字节编码 1BYTE = 8 bits(经常用16进制表示)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SKQbGylK-1669515562441)(/pic/ELF/图片5.png “Magic Gardens”)]
其中又分为动态存储区和静态存储区。动态存储区如Stack和Heap。静态则是各种的segment。
1.6 段与节
一个段包含多个节。段视图用于进程的内存区域的rwx权限划分。节视图用于ELF文件编译链接时与在磁盘上存储时的文件结构的组织。
GOT, 即Global Offset Table, 全局偏移表. 是链接器在执行链接时实际上要填充的部分, 保存了所有外部符号的地址信息。每个函数占用一个GOT表项。每个被目标模块引用的全局符号(函数或者变量)都对应于GOT中一个8字节的条目
PLT全称Procedure Linkage Table,即过程链接表。它在可执行文件中也是一个单独的section,位于.text section的前面。每个被可执行程序调用的库函数都有它自己的PLT条目。每个条目实际上都是一小段可执行的代码。
.got.plt相当于.plt的GOT全局偏移表, 其内容有两种情况, 1)如果在之前查找过该符号,内容为外部函数的具体地址。2)如果没查找过, 则内容为跳转回.plt的代码, 并执行查找。(emmm,有点PE中的IET IAT那味了)
.got保存全局变量引用的地址,.got.plt保存函数引用地址。
贴个图,希望可以帮助大家理解
关于.got和.plt的话,可以参考这两篇文章。
https://blog.youkuaiyun.com/u011987514/article/details/67716639
https://linyt.blog.youkuaiyun.com/article/details/51635768
下面在介绍一些常见的段和结构:
bss段:
bss段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。
bss是英文Block Started by Symbol的简称。
bss段属于静态内存分配。
data段:
数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。
数据段属于静态内存分配。
text段:
代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。
这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读(某些架构也允许代码段为可写,即允许修改程序)。
在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。
堆(heap):
堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。
当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);
当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)。
栈(stack):
栈又称堆栈,是用户存放程序临时创建的局部变量,
也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。
除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。
由于栈的先进先出(FIFO)特点,所以栈特别方便用来保存/恢复调用现场。
从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。
1.7 大端序与小端序
小端序:低地址在数据低位,高地址在数据高位
大端序:低地址在数据高位,高地址在数据低位
如 0A0B0C0D在小端序的排列顺序:
a : 0D
a+1 : 0C
a+2 : 0B
a+3 : 0A
1.8 动态链接与静态链接
静态链接方式:在程序执行之前完成所有的组装工作,也就是说源代码中的函数已经包含进了可执行程序,生成一个可执行的目标文件(ELF文件)该文件包含了运行时所需的全部代码。(体积大)
动态链接方式:动态链接是相对于静态链接来说的。他并没有把函数拷贝到可执行文件中,而是在其中加入了所调用函数的描述信息(往往是一些重定位信息)。当程序装入内存开始运行时(不知道看到这里,大家是否会联想到上面的.plt与.got呢?),与.so建立链接关系
1.9 常用的汇编指令
- MOV dest, src ;把源操作数传送给目标
- LEA REG,SRC ; 把源操作数的地址传到保存的位置
- PUSH与POP ;压栈与入栈
- LEAVE ;函数返回时候,恢复栈帧
传送给目标 - LEA REG,SRC ; 把源操作数的地址传到保存的位置
- PUSH与POP ;压栈与入栈
- LEAVE ;函数返回时候,恢复栈帧
- RET ;在函数返回时候,控制程序执行流返回父函数