浅谈sar指令在整数除法中的优化

最新推荐文章于 2023-08-23 09:21:33 发布

转载最新推荐文章于 2023-08-23 09:21:33 发布 · 1k 阅读

常用专栏收录该内容

2 篇文章

订阅专栏

探讨SAR指令在整数除法中的应用及优化技巧，包括2^n除法和非2^n除法的实现原理及具体步骤。

标题: 【转载】浅谈sar指令在整数除法中的优化

初学《加密与解密3》看到第四章里的编译器的算法优化时的一点困惑，然后动手实践了一下得到一点心得体会，拿来跟大家分享！
ps.本人汇编基础非常差，sar指令也是刚刚学会的，另外脑袋转的慢，别人用5分钟能解决的问题，我得用10分钟，因此这篇文章我花了6个多小时才完成。
如果有错误欢迎指出，以免误导他人！

浅谈Sar指令在整数除法中的优化

还不懂sar指令的同学马上去baidu啊，Google啊查去，我刚查完！
首先来看一段vc代码

代码:

int get()
{
  return -8;
}

int main()
{
  int a = get()/2;
  printf("%d",a);
  return 0;
}

汇编代码（本文里反汇编码都是指Release版本下的OD返回编码）如下

代码:

00401000  /$  B8 F8FFFFFF   mov     eax, -8   ; get子程序 总是返回-8
00401005  \.  C3            retn
00401006      90            nop
00401010  /$  E8 EBFFFFFF   call    00401000  ;得到返回值 eax = -8
00401015  |.  99            cdq                ;将eax的值符合扩展到edx
00401016  |.  2BC2          sub     eax, edx   ;等价于 eax = eax + 符号位（eax为正数或者0时符号位为0，负数时为1）
00401018  |.  D1F8          sar     eax, 1      ;带符合右移一位
0040101A  |.  50            push    eax
0040101B  |.  68 30704000   push    00407030      ;  ASCII "%d"
00401020  |.  E8 0B000000   call    00401030       ;printf函数
00401025  |.  83C4 08       add     esp, 8
00401028  |.  33C0          xor     eax, eax
0040102A  \.  C3            retn
0040102B      90            nop

简单的伪代码表示如下

代码:

Mov eax, idata              ;idata表示一个整数
Add eax, eax的符号位
Sar eax, 1

上面是一个整数/2的情况
如果一个整数/2^n(这里2^n表示2的n次方) 应该如何表示呢
我们将上面的VC代码修改这么一句
int a = get()/2; => int a = get()/16;
通过反汇编自己翻译成伪代码就是这样的

代码:

Mov eax, idata              ;idata表示一个整数
Add eax, (eax的符号位)*(2^n - 1) ;这里n=4
Sar eax, n

上面这个就是一般的除数是2^n一般的公式了，正负整数都管用

粗略的用这样一个数学公式来表示：
Idata/(2^n) = YWn(idata+2^n - 1)
注意 YWn表示将其后面的数以sar方式移动n位即 sar (数),n

再变换一下，将idata换成(idata – 2^n + 1)
(Idata – 2^n+1)/(2^n) = YWn(idata) -----------最终公式

Ps.上面的公式是我OD反汇编总结出来的，缺少数学的严格推理证明。我不会证，谁来证明下啊？感激不尽！

下面来解释一个难点，也是写本文的初衷
看一段VC代码：

代码:

int get()
{
  int i=rand()%2;
   if(i)
  return rand();
   else
   return rand()*(-1);
}

int main()
{
  int a = get()/9;
  printf("%d",a);
  return 0;
}

反汇编码：

代码:

00401010  /$  E8 EBFFFFFF   call    00401000   ;调用get函数 eax=随即数
00401015  |.  8BC8          mov     ecx, eax  ; ecx = eax
00401017  |.  B8 398EE338   mov     eax, 38E38E39 ;这是一个编译器预先设定好的MagicNumber
0040101C  |.  F7E9          imul    ecx ;带符合的乘法，不多说
0040101E  |.  D1FA          sar     edx, 1 ;将乘法的高32位结果算数右移一位
00401020  |.  8BC2          mov     eax, edx ;eax = edx
00401022  |.  C1E8 1F       shr     eax, 1F   ;逻辑右移31位
00401025  |.  03D0          add     edx, eax ;以上这3句的意思就是  edx = edx+edx的符号位，本文最重要的目的就是解释他为什么加1
00401027  |.  52            push    edx
00401028  |.  68 30704000   push    00407030              ;  ASCII "%d"
0040102D  |.  E8 0E000000   call    00401040  ;printf edx
00401032  |.  83C4 08       add     esp, 8
00401035  |.  33C0          xor     eax, eax
00401037  \.  C3            retn

关于MagicNumber这里给你几个连接自己看，不多介绍
http://bbs.pediy.com/showthread.php?t=68849
http://bbs.pediy.com/showthread.php?t=81456
我们把上面的反汇编代码写成伪代码，如下

代码:

idata 表示一个32位有符号数，这里一定是有符号的，否则逻辑错误
magic 表示立即数0x38E38E39  他是一个正数
FH(idata) 表示idata的最高位，即 FH(idtat) = (idata & 0x80000000)? 1:0
[edx,eax]表示 edx和eax组成的64位的寄存器

Mov [edx,eax], magic*idata
Sar [edx,eax],33      ;由于移位的操作此时eax里面的值已经没有意义了
Add edx + idata的符号位  ;因为magic是个正数，所以等价于magic*idata的符号位

而我们的本意是 idata/9
因此得到如下数学公式，我们就是要证明他的正确性
YW33(magic*idata) + FH(idata) = idata/9          -------------- (黄金公式)
①.  当FH(idata) == 0时
上述黄金公式即
Magic*idata/2^33 = idata/9
即
Magic*9 = 2^33
我们将magic = 0x0x38E38E39带入  然后用科学计算器验证了下结果如下
Magic*9 = 0x200000001
2^33 = 0x200000000
这种优化的除法本身就是一种近似，这里不多讨论为什么存在一个1的差异
证毕。
②.  当FH(idata) == 1时
由最终公式(Idata – 2^n+1)/(2^n) = YWn(idata)
得到
YW33(magic*idata) = (magic*idata – 2^33 + 1)/(2^33)
将右边带入黄金公式即：
(magic*idata – 2^33 + 1)/(2^33) + 1 = idata/9
即
Magic*idata/2^33 – 1 + 1 = idata/9          (;1/2^33 ≈ 0因此忽略掉)
即
Magic*idata/2^33 = idata/9
即
Magic*9 = 2^33

浅谈Sar指令在整数除法中的优化

第一部分

首先来看一段vc代码

int get()

{

return-8;

}

int main()

{

inta = get()/2;

printf("%d",a);

return0;

}

汇编代码（本文里反汇编码都是指Release版本下的OD返回编码）如下

00401000 /$ B8 F8FFFFFF mov eax, -8 ; get子程序总是返回-8

00401005 \. C3 retn

00401006 90 nop

00401010 /$ E8EBFFFFFF call 00401000 ;得到返回值 eax = -8

00401015 |. 99 cdq ;将eax的值符合扩展到edx

00401016 |. 2BC2 sub eax, edx ;等价于 eax = eax + 符号位（eax为正数或者0时符号位为0，负数时为1）

00401018 |. D1F8 sar eax, 1 ;带符合右移一位

0040101A |. 50 push eax

0040101B |. 6830704000 push 00407030 ; ASCII "%d"

00401020 |. E80B000000 call 00401030 ;printf函数

00401025 |. 83C4 08 add esp, 8

00401028 |. 33C0 xor eax, eax

0040102A \. C3 retn

0040102B 90 nop

简单的伪代码表示如下

moveax, idata ;idata表示一个整数

addeax, eax的符号位

sareax, 1

上面是一个整数/2的情况

如果一个整数/2^n(这里2^n表示2的n次方) 应该如何表示呢

我们将上面的VC代码修改这么一句

inta = get()/2; => int a = get()/16;

通过反汇编自己翻译成伪代码就是这样的

moveax, idata ;idata表示一个整数

addeax, (eax的符号位)*(2^n - 1) ;这里n=4

sareax, n

上面这个就是一般的除数是2^n一般的公式了，正负整数都管用

粗略的用这样一个数学公式来表示：

idata/(2^n) = YWn(idata+2^n - 1)

注意 YWn表示将其后面的数以sar方式移动n位即 sar (数),n

再变换一下，将idata换成(idata – 2^n + 1)

(idata – 2^n+1)/(2^n) = YWn(idata) ------- (最终公式)

ps.上面的公式是我OD反汇编总结出来的，缺少数学的严格推理证明。我不会证，谁来证明下啊？感激不尽！

注：(以上2个公式仅对负数管用，正数的公式是idata/(2^n)= YWn(idata) )

第二部分

再看一段VC代码：

int get()

{

inti=rand()%2;

if(i)

returnrand();

else

return rand()*(-1);

}

int main()

{

inta = get()/9;

printf("%d",a);

return0;

}

反汇编码：

00401010 /$ E8EBFFFFFF call 00401000 ;调用get函数 eax=随即数

00401015 |. 8BC8 mov ecx, eax ; ecx = eax

00401017 |. B8398EE338 mov eax,38E38E39 ;这是一个编译器预先设定好的MagicNumber

0040101C |. F7E9 imul ecx ;带符合的乘法，不多说

0040101E |. D1FA sar edx, 1 ;将乘法的高32位结果算数右移一位

00401020 |. 8BC2 mov eax, edx ;eax =edx

00401022 |. C1E8 1F shr eax, 1F ;逻辑右移31位

00401025 |. 03D0 add edx, eax ;以上这3句的意思就是 edx = edx+edx的符号位，本文最重要的目的就是解释他为什么加1

00401027 |. 52 push edx

00401028 |. 6830704000 push 00407030 ; ASCII"%d"

0040102D |. E80E000000 call 00401040 ;printf edx

00401032 |. 83C4 08 add esp, 8

00401035 |. 33C0 xor eax, eax

00401037 \. C3 retn

关于MagicNumber这里给你几个连接自己看，不多介绍

http://bbs.pediy.com/showthread.php?t=68849

http://bbs.pediy.com/showthread.php?t=81456

我们把上面的反汇编代码写成伪代码，如下

idata表示一个32位有符号数，这里一定是有符号的，否则逻辑错误

magic表示立即数0x38E38E39 他是一个正数

FH(idata)表示idata的最高位，即 FH(idtat) = (idata & 0x80000000)? 1:0

[edx,eax]表示 edx和eax组成的64位的寄存器

mov[edx,eax], magic*idata

sar[edx,eax],33 ; 移位的操作执行完本行指令后eax里面的值就没有意义了

addedx + idata的符号位 ;因为magic是个正数，所以等价于magic*idata的符号位

而我们的本意是 idata/9

因此得到如下数学公式，我们就是要证明他的正确性

YW33(magic*idata) + FH(idata) = idata/9 ---------- (黄金公式)

①.当FH(idata) == 0时

上述黄金公式即

magic*idata/2^33 = idata/9

即

magic*9 = 2^33

我们将magic = 0x0x38E38E39带入然后用科学计算器验证了下结果如下

magic*9 = 0x200000001

2^33 = 0x200000000

这种优化的除法本身就是一种近似，这里不多讨论为什么存在一个1的差异

证毕。

②.当FH(idata) == 1时

由最终公式 (Idata – 2^n+1)/(2^n) = YWn(idata)

得到

YW33(magic*idata) = (magic*idata – 2^33+ 1)/(2^33)

将右边带入黄金公式即：

(magic*idata – 2^33 + 1)/(2^33) + 1 =idata/9

即

Magic*idata/2^33 – 1 + 1 = idata/9 (;1/2^33 ≈ 0因此忽略掉)

即

magic*idata/2^33 = idata/9

即

magic*9 = 2^33

证毕。

对于公式Idata/(2^n)=YWn(idata+2^n-1)
有一点需要说明，即intel使用的有符号除法的商是采取向零圆整的方式(如：(-5)/2=-2……-1，5/2=2……1)，所以对于不能整除的数，移位的结果与商差1。这就是移位前加上(2^n-1)的原因。

假设负数idata的补码二进制表示为
bbbbb……b
______
↑
n位

(2^n-1)二进制表示为
00001……1
______
↑
n位

如果idata能够整除(2^n)，则其二进制补码末尾n位应该都是零，此时加上(2^n-1)再移位与直接移位结果相同，结果等于商
如果idata不能整除(2^n),则末尾n位中必有不是零的部分，此时加上(2^n-1)再移位相当于将移位结果加1，这样就与商相等了。