深刻认识 -->> 立即数

本文详细解释了ARM汇编语言中立即数的作用及其构造原理,包括如何利用12位表示32位常数,以及如何判断一个数是否为立即数。此外,还介绍了规避立即数限制的方法和有效数的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在ARM汇编的数据处理指令中经常会使用到常数,而ARM汇编中规定使用的常数必 须是立即数;为什么会有立即数这样的规定呢?

答:这是由于所有的ARM指令是精简指令集,指令长度固定都是32位,对于ARM数据处理指令自然也是一样。数据处理指令大致可包含3类,数据传送指令、数据算术逻辑运算指令和数据比较指令。在一条ARM数据处理指令中,除了要包含处理的数据值外,还要标识ARM命令名称,控制位,寄存器等其他信息。这样在一条ARM数据处理指令中,能用于表示要处理的数据值的位数只能小于32位;

一条ARM指令语法格式分为如下几个部分:

<opcode>{<cond>}{S} <Rd>,<Rn>{,<shifter_operand>}

其中,<>内的项是必须的,{}内的项是可选的,如<opcode>是指令助记符,是必须的,而{<cond>}为指令执行条件,是可选的,如果不写则使用默认条件AL(无条件执行)。

Opcode   指令助记符,如LDR,STR 

Cond       执行条件,如EQ,NE 

                 是否影响CPSR 寄存器的值,书写时影响CPSR,否则不影响

       Rd          目标寄存器

Rn          第一个操作数的寄存器

shifter_operand      第二个操作数(第二操作数有三种形式: 1-- 立即数 add r1,r2,#10 ; 2-- 寄存器 addeqs r1,r2,r3 @ r1=r2+r3 ; 3-- 寄存器移位 add r1,r2,r3,LSL #2 @ r1 = r2 +r3*4


 ARM在指令格式中设定,只能用指令机器码32位中的低12位来表示要操作的常数。ARM处理器是按32位来处理数据的,ARM处理器处理的数据是32位,如果简单的用这12位来表示,显然范围太小了,为了扩展到32位,因此使用了构造的方法,在12位中用8位表示基本数据值,用4位表示位移值,通过用8位基本数据值往右循环移动4位位移值*2次,来表示要操作的常数。这里要强调最终的循环次数是4位位移值乘以2得到的,所以得到的最终循环次数肯定是一个偶数,为什么要乘以2呢,实质还是因为范围不够,4位表示位移次数,最大才15次(移位值==0:等于没有循环,不算),加上8位数据还是不够32位,这样只能通过ALU的内部结构设计将4位位移次数乘以2,这样就能用12位表示32位常数了。

立即数表示方法:立即数(#immed_8r) = X循环右移Y*2; //为何要*2 ? 答:红色。为何要移偶数位? 因为要*2 构造成32位

[31         11][11   8]  Y:移位值最大 1111b = 15[7  0] X:8bit常数
所以对#immed_8r常数表达式的限制是解决指令编码的第二个操作数位数不足以表示32位操作数的无奈之举,但总比只有12位所表达的数大。

所以:一个8bit常数循环右移(Y*2 = {0,2,4,6,8, ...,26, 28, 30})就得到一个立即数了;

判断是不是立即数用人脑 真真是太烦了,但是总结了个比较快速的方法:

1、把数据转换成二进制形式,从低位到高位写成4位1组的形式,最高位一组不够四位的,在最高位前面补0。

2、数1的个数,如果大于8个肯定不是立即数,如果小于等于8进行下面步骤。

3、如果数据中间有连续的大于等于24个0, 循环左移4的倍数,使高位全为0。

4、找到最高位的1,去掉前面最大偶数个0。

5、找到最低位的1,去掉后面最大偶数个0。

6、数剩下的位数,如果小于等于8位,那么这个数就是立即数,反之就不是立即数。

典型例子:(1)0x4FF (2)0x122 (3)0x234 (4)0xF000000F (5)0x8000007F

例2: 0x4FF

第一步:0100 1111 1111

第二步:其中1的个数是9个,大于8个,判定不是立即数

例2: 0x122

第一步: 0001 0010 0010

第二步: 其中1的个数4个,小于8,继续

第三步: 其中没有连续大于等于24个0,继续

第四部: xx01 0010 0010 (最高位前面有3个0,最大偶数2,去掉2个0)

第五步: xx10 0011 0010 (最低位后面只有1个0,最大偶数0)

第六部: 剩下10 0011 0010 共10位,大于8,判定0x122不是立即数

例3: 0x234

第一步: 0010 0011 0100

第二步: 其中1的个数4个,小于8,继续

第三步: 其中没有连续大于等于24个0,继续

第四部: xx10 0011 0100

第五步: xx10 0011 01xx

第六部: 剩下10 0011 01 共8位,等于8,判定0x234是立即数

例4: 0xF000000F

第一步: 1111 0000 0000 0000 0000 0000 0000 1111

第二步: 其中1的个数8个,没有大于8,继续

第三步: 其中有连续24个0,循环左移4位,使高位全为0

0000 0000 0000 0000 0000 0000 0000 1111 1111

第四部: xxxx xxxx xxxx xxxx xxxx xxxx xxxx 1111 1111

第五步: xxxx xxxx xxxx xxxx xxxx xxxx xxxx 1111 1111

第六部: 剩下1111 1111共8位,等于8,判定0xF000000F是立即数

例5: 0x8000007F

第一步: 1000 0000 0000 0000 0000 0000 0111 1111

第二步: 其中1的个数8个,没有大于8,继续

第三步: 其中有连续24个0,循环左移4位,使高位全为0

0000 0000 0000 0000 0000 0000 0111 1111 1000

第四部: xxxx xxxx xxxx xxxx xxxx xxxx 0111 1111 10xx

第五步: xxxx xxxx xxxx xxxx xxxx xxxx 0111 1111 10xx

第六部: 剩下0111 1111 10共10位,大于8,判定0x7000008F不是立即数

问题还没有结束,我们在ARM汇编中如何规避立即数这个问题呢,其实可以使用ARM汇编LDR伪指令,例如直接把MOV指令变为, LDR R1,=0x12345678这样编译器就不会报错了。但这种方法也有弊端会增加开销和影响执行效率。同时ARM汇编中还有有效数的概念,比如 MOV R1,#0xFFFFFFFF 指令中 0xFFFFFFFF 不是立即数,但是是有效数,编译器最自动把原指令变换为 MVN R1,#0,也不会报错。有效数判定:原数是立即数或者原数反码是立即数。

例子: mov r1, #0x80000016   @ #0x80000016(1000 0000 0000 0000 0000000 0001 0110b) 是一个立即数: 由01011010b 右循环2位得到;

  mov r0, #0x101 @不是立即数 报错Error: invalid constant (101) after fixup

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值