ARM 汇编指令

原创已于 2024-12-24 16:17:49 修改 · 1.1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#汇编

于 2024-11-13 10:26:58 首次发布

ARM汇编专栏收录该内容

2 篇文章

订阅专栏

blr指令的基本概念和用途
- 在 ARM64 汇编中，blr是 “Branch with Link to Register” 的缩写。它是一种分支指令，主要用于跳转到一个由寄存器指定的地址，并将返回地址保存到链接寄存器（Link Register，LR）中。这个指令在函数调用过程中起到关键作用，类似于高级语言中的函数调用机制。
- 指令格式通常为blr <Xn>，其中<Xn>是一个通用寄存器，它包含了要跳转到的目标函数或代码块的地址。当执行blr指令时，程序流程会跳转到<Xn>寄存器所指向的地址，并且会把当前指令的下一条指令地址（也就是返回地址）存入 LR 寄存器，以便在被调用的函数或代码块执行完毕后能够正确地返回到调用点。
blr指令在函数调用中的作用机制
- 函数调用示例：假设我们有一个主函数和一个被调用的子函数。在主函数中，我们要调用子函数，并且在 ARM64 汇编中实现这个过程。

; 主函数部分
mov x0, #10       ; 假设设置一个参数，将10存入x0寄存器
adrp x1, my_sub_function ; 获取子函数地址所在页面的基地址，存入x1
add x1, x1, #:lo12:my_sub_function ; 计算子函数的确切地址，存入x1
blr x1            ; 跳转到子函数，将返回地址存入LR寄存器

; 子函数部分（my_sub_function）
; 子函数可以从x0寄存器获取参数进行操作
;...子函数的具体操作...
ret               ; 子函数执行完毕，通过ret指令返回，ret指令会从LR寄存器获取返回地址并跳转

在这个示例中，blr指令实现了从主函数跳转到子函数的操作。在跳转到子函数之前，参数可以通过寄存器（如x0）传递给子函数。当blr指令执行时，它会将主函数中blr指令的下一条指令地址存入 LR 寄存器。子函数执行完后，通过ret指令返回，ret指令会自动从 LR 寄存器中获取返回地址并跳转到主函数的相应位置，从而实现函数调用和返回的完整流程。
与其他指令的对比和关联
- 与b指令的对比：b（分支）指令是一种简单的无条件跳转指令，它只是跳转到一个指定的地址，不会保存返回地址。而blr指令在跳转的同时保存返回地址，这使得它适用于函数调用场景。例如，b my_label只是简单地跳转到my_label标记的位置，而blr指令则用于调用一个函数或代码块，并且能够确保正确返回。
- 与blr相关的指令：ret指令与blr指令紧密相关。ret指令用于从一个被调用的函数或代码块返回，它的操作是从 LR 寄存器获取返回地址并跳转。在函数调用的整个过程中，blr和ret指令协同工作，实现了类似于高级语言中函数调用和返回的功能。另外，在设置目标地址时，adrp和add指令常常与blr指令配合使用，用于准确地定位要跳转到的函数或代码块的地址，就像前面示例中展示的那样。

str指令的基本概念
- 在 ARM64 汇编中，str是存储（Store）指令。它的主要作用是将一个寄存器中的数据存储到内存中。ARM64 架构采用了加载 / 存储（Load/Store）架构，这意味着数据的处理和存储是分开的操作，str指令用于完成存储这一环节。
- 指令格式通常为str <register>, [<address>]，其中<register>是要存储数据的寄存器，<address>是数据存储的目标内存地址。这个内存地址可以是一个寄存器（里面存放着实际的内存地址），也可以是一个通过某种寻址方式计算出来的内存地址表达式。
简单示例及说明
- 假设我们有一个寄存器x0，里面存放着一个 32 位的数据，我们想要把这个数据存储到内存地址为0x1000的位置。可以使用以下指令：

ldr x1, =0x1000  ; 将内存地址0x1000加载到寄存器x1中
str x0, [x1]     ; 将寄存器x0中的数据存储到x1所指向的内存地址（0x1000）

在这个例子中，首先通过ldr指令（加载指令）将内存地址0x1000加载到x1寄存器中。然后使用str指令，将x0寄存器中的数据存储到x1所指向的内存位置。
寻址方式与str指令的结合
寄存器间接寻址：这是一种常见的寻址方式。例如，str x0, [x1]就是寄存器间接寻址，内存地址由x1寄存器的值确定。这种方式很灵活，因为x1的值可以在程序运行过程中动态改变，从而可以将数据存储到不同的内存位置。
基址加偏移量寻址：ARM64 还支持基址加偏移量的寻址方式。例如，str x0, [x1, #8]表示将x0中的数据存储到x1寄存器所指向的内存地址再加上偏移量8字节后的位置。这个偏移量可以是一个立即数（像这里的#8），也可以是另一个寄存器的值。
预索引和后索引寻址：ARM64 中有预索引和后索引寻址方式。以预索引为例，str x0, [x1, #8]!，这里的!表示在存储操作完成后，x1寄存器的值会更新为x1 + 8，即指向存储操作后的下一个内存位置。后索引方式类似，但x1寄存器的值是在存储操作完成后才更新。
数据宽度和对齐要求
在 ARM64 中，str指令存储的数据宽度可以是不同的，例如 32 位（str w0, [x1]）或 64 位（str x0, [x1]）。这里w0是 32 位寄存器，x0是 64 位寄存器。
同时，ARM64 对存储操作有内存对齐要求。对于 64 位的数据存储，内存地址通常需要是 8 字节对齐的；对于 32 位的数据存储，内存地址通常需要是 4 字节对齐的。如果不满足对齐要求，可能会导致性能下降或者产生未定义行为。例如，在某些 ARM64 处理器上，试图将一个 64 位的数据存储到一个没有 8 字节对齐的内存地址可能会触发异常。

CBZ 指令概述
- 在 ARM Linux 中，CBZ（Compare and Branch on Zero）是一条条件分支指令。它主要用于比较一个寄存器的值是否为零，然后根据比较结果决定是否进行分支跳转。这是一种高效的控制流指令，用于在程序中实现条件判断和跳转逻辑，通常可以优化程序的执行流程，减少不必要的指令执行。
指令格式和操作数
- 基本格式为 “CBZ <Rn>, <label>”。其中，<Rn>是要进行比较的寄存器，这个寄存器中存储的值将与零进行比较；<label>是一个标签，表示分支跳转的目标地址。当<Rn>寄存器中的值为零时，程序流程将跳转到<label>所标记的位置继续执行；如果<Rn>中的值不为零，则程序将继续顺序执行下一条指令。
- 例如，“CBZ x0, my_label”，这条指令会检查 x0 寄存器中的值是否为零。如果 x0 的值为零，那么程序会跳转到名为 “my_label” 的代码位置继续执行；如果 x0 的值不为零，程序会执行 CBZ 指令后面的下一条指令。
工作原理和执行流程
- 当执行 CBZ 指令时，处理器首先读取<Rn>寄存器中的值，然后与零进行比较。这一比较过程是通过硬件的比较电路快速完成的。如果比较结果为相等（即寄存器值为零），处理器会更新程序计数器（PC）的值，使其指向<label>所代表的目标地址，从而实现分支跳转。这个目标地址通常是在程序代码的其他位置，可能是在当前函数内部的某个位置，用于处理值为零的情况；也可能是跳转到另一个函数或者错误处理代码块等。
- 例如，在一个简单的函数中，可能会用 CBZ 指令来检查函数传入的参数是否为零。假设函数接收一个参数存储在寄存器 x0 中，代码中有 “CBZ x0, handle_zero_case” 这样的指令。如果 x0 为零，程序会跳转到 “handle_zero_case” 标签处，可能在那里进行一些特定的零值处理操作，如返回错误码或者进行特殊的初始化；如果 x0 不为零，程序会继续执行后续的正常操作，如使用这个参数进行计算等。
应用场景
- 函数参数检查：在函数开始处，经常使用 CBZ 来检查传入的参数是否为零。例如，一个计算阶乘的函数，在接收一个整数参数 n 时，可以用 CBZ 检查 n 是否为零，因为 0 的阶乘定义为 1。如果 n 为零，就可以直接返回 1，避免不必要的计算。
- 循环控制：在一些简单的循环结构中，CBZ 可以用于判断循环是否结束。比如，有一个循环是通过一个计数器来控制的，当计数器的值存储在一个寄存器中，并且计数器递减到零时，就可以使用 CBZ 指令来检测并跳出循环。
- 错误处理和异常情况检测：在处理系统调用或者硬件设备交互时，CBZ 可以用于检测错误返回值。例如，当从一个设备读取数据时，如果返回的状态寄存器的值存储在某个寄存器中，通过 CBZ 指令可以快速判断是否出现错误（通常零表示成功，非零表示出现某种问题），并跳转到相应的错误处理代码段。

`ldrb`指令含义

ldrb w5, [x2] 是一条汇编指令，常见于 ARM 架构的汇编语言中，以下是对它的详细解释：

ldrb 是 “Load Register Byte”（加载字节到寄存器）的缩写，它的功能是从内存中读取一个字节的数据，并将其加载到指定的寄存器中。

操作数说明

w5：这是目标寄存器。在 ARM 架构中，寄存器有不同的命名方式和用途，w 开头的寄存器表示 32 位的通用寄存器（在这里是 w5），用于存放操作数、运算结果等数据。当执行这条指令后，从内存读取到的那个字节数据就会被存放在 w5 寄存器中。
[x2]：x2 也是一个寄存器（x 开头表示 64 位通用寄存器），这里方括号的用法表示间接寻址。也就是说，指令要读取的那个字节数据所在的内存地址是由 x2 寄存器中的值来指定的。简单来讲，就是会去 x2 寄存器所指向的内存地址处获取一个字节的数据，然后装载到 w5 寄存器中。

例如，假设 x2 寄存器中存放的值是内存地址 0x1000，那么这条指令就会从内存地址 0x1000 处读取一个字节的数据，再把这个字节数据放到 w5 寄存器里面，方便后续程序对这个字节数据进行处理，比如进行比较、运算或者作为参数传递等操作。

总的来说，ldrb w5, [x2] 指令实现了从内存特定位置读取一个字节数据到指定寄存器的功能，这在 ARM 架构的程序编写，尤其是涉及内存数据操作的场景中经常会用到。

mrs指令

指令全称和基本含义
- mrs是 ARM 架构中的一条指令，全称为 “Move from Special - Register”，即从特殊寄存器读取数据。它用于将特殊寄存器（如程序状态寄存器、协处理器控制寄存器等）中的内容传送到通用寄存器中。
指令格式和操作数
- 指令格式一般为：mrs <Rd>, <special - register>。其中 <Rd> 是目标通用寄存器，用于存放从特殊寄存器读取的数据；<special - register> 是源特殊寄存器，例如 cpsr（当前程序状态寄存器）、spsr（保存程序状态寄存器）、mpidr_el1（多处理器亲和性寄存器，用于多核系统中识别处理器核心）等。例如，mrs x0, cpsr 指令会将当前程序状态寄存器 cpsr 的内容读取到通用寄存器 x0 中。
应用场景
- 获取处理器状态信息：在操作系统内核开发或者底层驱动开发中，常常需要获取处理器的当前状态，如当前的运行模式（用户模式、特权模式等）、中断使能状态等。通过 mrs 指令读取 cpsr 的内容，就可以获取这些信息，然后根据这些状态信息进行相应的处理。例如，在中断处理程序中，可以先使用 mrs 指令读取 cpsr，判断中断是否是被允许的状态，来决定是否需要重新配置中断相关的设置。
- 多核系统中的核心识别和配置：在多核 ARM 系统中，mpidr_el1 等寄存器用于区分不同的处理器核心。通过 mrs 指令将 mpidr_el1 的内容读取到通用寄存器后，可以进行核心的识别操作。例如，根据读取到的核心编号来分配不同的任务、设置不同的内存映射或者初始化与核心相关的特定硬件资源。
- 与其他指令配合进行系统初始化和异常处理：在系统启动或者从异常状态恢复时，需要获取系统的状态信息并进行相应的初始化操作。mrs 指令可以与其他指令（如 msr - 用于向特殊寄存器写入数据、b - 跳转指令等）配合使用。比如，在系统复位后，先使用 mrs 指令获取特殊寄存器中的复位原因等信息，然后根据这些信息跳转到相应的初始化代码段进行系统初始化。