ARM函数调用时参数传递规则

本文介绍ARM体系中ATPCS规定的函数参数传递规则。当参数数量小于等于4时,使用R0-R3寄存器传递;参数数量大于4时,剩余部分通过堆栈传递。文章提供了具体的汇编与C代码示例,展示不同参数数量下的调用过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ARM函数调用时参数传递规则

之前在学习如何在C语言中嵌入汇编时有了解到C语言之前的参数调用是使用寄存器R0传递第一个参数,R1传递到第二个..一直到R3传递第四个参数.但是 实际上有时可能传递的参数非常多,超过8个,或是参数中有浮点数之类,参数也会超过4个寄存器,对于超出的部份并不使用

     之前在学习如何在C语言中嵌入汇编时有了解到C语言之前的参数调用是使用寄存器R0传递第一个参数,R1传递到第二个..一直到R3传递第四个参数.但是 实际上有时可能传递的参数非常多,超过8个,或是参数中有浮点数之类,参数也会超过4个寄存器,对于超出的部份并不使用R4,而是使用堆栈的方式,但具体 是如何的方式很多网站就没了下文了,好在在GG的帮助下,让我在凌晨1.30找到了(为啥老是在半夜呢?)

—————————————————-华丽的分割线————————————————

对于ARM体系来说,不同语言撰写的函数之间相互调用(mix calls)遵循的是 ATPCS(ARM-Thumb Procedure Call Standard),ATPCS主要是定义了函数呼叫时参数的传递规则以及如何从函数返回,关于ATPCS的详细内容可以查看ADS1.2 Online Books ——Developer Guide的2.1节。这篇文档要讲的是 汇编代码中对C函数调用时如何进行参数的传递以及如何从C函数正确返回

不同于x86的参数传递规则,ATPCS建议函数的形参不超过4个,如果形参个数少于或等于4,则形参由R0,R1,R2,R3四个寄存器进行传递;若形参个数大于4,大于4的部分必须通过堆栈进行传递。

我们先讨论一下形参个数为4的情况.
实例1:
test_asm_args.asm
//——————————————————————————–
        IMPORT test_c_args ;声明test_c_args函数
        AREA TEST_ASM, CODE, READONLY
        EXPORT test_asm_args
test_asm_args
       STR lr, [sp, #-4]! ;保存当前lr
        ldr r0,=0×10       
;参数 1
        ldr r1,=0×20        
;参数 2
        ldr r2,=0×30        
;参数 3
        ldr r3,=0×40       ;参数 4
        bl test_c_args      
;调用C函数
        LDR pc, [sp], #4  
;将lr装进pc(返回main函数)
        END
test_c_args.c
//——————————————————————————–
void test_c_args(int a,int b,int c,int d)
{
        printk(”test_c_args:\n”);
        printk(”%0x %0x %0x %0x\n”,a,b,c,d);
}
main.c
//——————————————————————————–
int main()
{
     test_asm_args();
     for(;;);
}

程序从main函数开始执行,main调用了test_asm_args,test_asm_args调用了test_c_args,最后从test_asm_args返回main.
代码分别使用了汇编和C定义了两个函数,test_asm_args 和 test_c_args,test_asm_args调用了test_c_args,其参数的传递方式就是向R0~R3分别写入参数值,之后使用bl语句 对test_c_args进行调用。其中值得注意的地方是用红色标记的语句,test_asm_args在调用test_c_args之前必须把当前的 lr入栈,调用完test_c_args之后再把刚才保存在栈中的lr写回pc,这样才能返回到main函数中。

如果test_c_args的参数是8个呢?这种情况test_asm_args应该怎样传递参数呢?
实例2:
test_asm_args.asm
//——————————————————————————–
        IMPORT test_c_args ;声明test_c_args函数
        AREA TEST_ASM, CODE, READONLY
        EXPORT test_asm_args
test_asm_args
       STR lr, [sp, #-4]! ;保存当前lr
       ldr r0,=0×1 ;参数 1
       ldr r1,=0×2 ;参数 2
       ldr r2,=0×3 ;参数 3
       ldr r3,=0×4 ;参数 4
      
 ldr r4,=0×8
       str r4,[sp,#-4]! ;参数 8 入栈
       ldr r4,=0×7
       str r4,[sp,#-4]! ;参数 7 入栈
       ldr r4,=0×6
       str r4,[sp,#-4]! ;参数 6 入栈
       ldr r4,=0×5
       str r4,[sp,#-4]! ;参数 5 入栈
       bl test_c_args_lots
       ADD sp, sp, #4     ;清除栈中参数 5,本语句执行完后sp指向 参数6 
       ADD sp, sp, #4     ;清除栈中参数 6,本语句执行完后sp指向 参数7
       ADD sp, sp, #4     ;清除栈中参数 7,本语句执行完后sp指向 参数8
       ADD sp, sp, #4     ;清除栈中参数 8,本语句执行完后sp指向 lr
       LDR pc, [sp],#4    
;将lr装进pc(返回main函数)
        END
test_c_args.c
//——————————————————————————–
void test_c_args(int a,int b,int c,int d,int e,int f,int g,int h)
{
       printk(”test_c_args_lots:\n”);
       printk(”%0x %0x %0x %0x %0x %0x %0x %0x\n”,
              a,b,c,d,e,f,g,h);
}
main.c
//——————————————————————————–
int main()
{
     test_asm_args();
     for(;;);
}

这部分的代码和实例1的代码大部分是相同的,不同的地方是test_c_args的参数个数和test_asm_args的参数传递方式。
在test_asm_args中,参数1~参数4还是通过R0~R3进行传递,而参数5~参数8则是通过把其压入堆栈的方式进行传递,不过要注意这四个入栈参数的入栈顺序,是以参数8->参数7->参数6->参数5的顺序入栈的。
直到调用test_c_args之前,堆栈内容如下:
sp->+———-+
        |  参数5  |
       +———-+
        |  参数6  |
       +———-+
        |  参数7  |
       +———-+
        |  参数8  |
       +———-+
        |     lr      |
       +———-+
test_c_args执行返回后,则设置sp,对之前入栈的参数进行清除,最后将lr装入pc返回main函数,在执行 LDR pc, [sp],#4 指令之前堆栈内容如下:
       +———-+
        |  参数5  |
       +———-+
        |  参数6  |
       +———-+
        |  参数7  |
       +———-+
        |  参数8  |
sp->+———-+
        |     lr      |
       +———-+ 

上面是转自http://lionwq.spaces.eepw.com.cn/articles/article/item/17475/  

但实际上可能不同的编译器可能用着不同的处理方式,于我们所使用的编译器我们可以写一个简单的代码,调用10个参数的函数,然后升成汇编再查看它是如何处理,这样再根据编译器进行特殊的优化.

### ARM 架构下的函数调用参数传递机制 在 ARM 架构下,尤其是 ARMv8-A 的 AArch64 模式中,函数调用涉及整数型参数的传递遵循特定规则。对于不超过四个的整数型参数,它们会通过寄存器 `X0` 到 `X3` 进行传递[^1]。如果参数数量超过四个,则超出部分会被放置到栈中。 具体来说,在 ARM 体系结构中,当函数调用,前四个参数按照从左至右的顺序依次放入寄存器 `R0` 至 `R3` 或者对应的宽位寄存器 `X0` 至 `X3` 中[^2]。例如,考虑如下函数声明: ```c void OLED_DrawBMP_test(unsigned char x0, unsigned char y0, unsigned char x1, unsigned char y1, unsigned char BMP[], unsigned char state1, unsigned char state2); ``` 此函数共有七个参数。其中,前四个参数 (`x0`, `y0`, `x1`, `y1`) 将被分别存储于寄存器 `R0` (或 `X0`)、`R1` (或 `X1`)、`R2` (或 `X2`) 和 `R3` (或 `X3`) 中[^3]。而剩余的三个参数 (`BMP[]`, `state1`, `state2`) 则需要借助栈来完成传递。这些额外的参数将以逆序的方式压入栈中,即最后的一个参数最先写入栈底位置。 这种设计旨在优化性能并简化实现逻辑——优先利用寄存器而非内存来进行数据交换可以显著降低访问延迟;而对于那些无法完全容纳进有限几个通用目的寄存器内的多余实参,则采用堆栈作为补充手段予以处理。 值得注意的是,上述过程并不严格匹配常见的 C 编程语言中的几种标准调用约定(__cdecl__, __stdcall__, __fastcall__),而是基于目标平台特性定制而成的一种高效方法。 此外,关于叶子节点类型的简单功能如 func1 所展示的例子表明即使是最基础的操作也会考虑到整个应用程序执行路径上的资源分配情况从而做出相应调整以适应不同场景需求[^4]。 ```python def arm_function_call(param_count): registers = ['X0', 'X1', 'X2', 'X3'] stack_params = [] if param_count <= 4: used_registers = registers[:param_count] return f"Parameters are passed via {used_registers}." else: extra_params = param_count - 4 for i in range(extra_params): stack_params.append(f"[SP#{i*8}]") # Assuming each parameter takes up 8 bytes. all_params = ', '.join(registers + stack_params[::-1]) # Reverse the list to match last-in-first-out order of stack. return f"The first four parameters use X0-X3 and any additional ones go onto the stack as follows: {all_params}." print(arm_function_call(7)) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值