昨天被问到了尾递归及编译器对它的处理相关,一直对它没有研究过,解释得很含糊。
回来查了下,记录如下:递归有线性递归(普通的递归)和尾递归。
由于尾递归的特殊性,一般的编译器会做些特殊处理。因此,在效率和开销上,比普通递归好。
举个例子,计算n!
1)线性递归:
type recurve(long n)
{
return (n == 1) ? 1 : n * recurve(n - 1);
}
2)尾递归:
type recurve_tail(long n, long result)
{
return (n == 1) ? result : recurve_tail(n - 1, result * n);
}
再封装成1)的形式:
type recurve(long n)
{
return (n == 0) ? 1 : recurve_tail(n, 1);
}
分析:
很容易看出, 普通的线性递归比尾递归更加消耗资源。每次调用都使得调用链条不断加长,系统不得不开辟新的栈进行数据保存和恢复;而尾递归就
不存在这样的问题, 因为他的状态完全由n 和 a 保存,并且,被调用函数返回的值即为要求的值,本函数再没有作用,于是本函数不再保存,直接在本函数堆栈上进行递归调用,
对于特殊情况,甚至可以不使用内存空间,直接在寄存器完成。
编译器如何判断是否尾递归?
返回的值是函数本身,没有其它选择。
看一下上述尾递归函数在gcc 4.3.2-1-1下未进行优化的编译结果:
.file "rec.c"
.text
.globl recurve_tail
.type recurve_tail, @function
recurve_tail:
pushl %ebp
movl %esp, %ebp
subl $24, %esp
cmpl $1, 8(%ebp)
je .L2
movl 12(%ebp), %eax
movl %eax, %edx
imull 8(%ebp), %edx
movl 8(%ebp), %eax
subl $1, %eax
movl %edx, 4(%esp)
movl %eax, (%esp)
call recurve_tail
movl %eax, -4(%ebp)
jmp .L3
.L2:
movl 12(%ebp), %eax
movl %eax, -4(%ebp)
.L3:
movl -4(%ebp), %eax
leave
ret
.size recurve_tail, .-recurve_tail
.ident "GCC: (Debian 4.3.2-1.1) 4.3.2"
.section .note.GNU-stack,"",@progbits
未进行优化,与普通递归处理方式相同,新开辟了栈;再看-O3优化结果:
.file "rec.c"
.text
.p2align 4,,15
.globl recurve_tail
.type recurve_tail, @function
recurve_tail:
pushl %ebp
movl %esp, %ebp
movl 8(%ebp), %edx
movl 12(%ebp), %eax
cmpl $1, %edx
je .L2
.p2align 4,,7
.p2align 3
.L5:
imull %edx, %eax
subl $1, %edx
cmpl $1, %edx
jne .L5
.L2:
popl %ebp
ret
.size recurve_tail, .-recurve_tail
.ident "GCC: (Debian 4.3.2-1.1) 4.3.2"
.section .note.GNU-stack,"",@progbits
*在makfile文件开头定义CFLAGS = -O2,这样使用makefile编译时才会优化;gdb中查看函数地址命令为:info line【函数名】;查看某个函数的汇编指令为:disass 【函数名】
原文出处:http://blog.youkuaiyun.com/hilyoo/article/details/4445476
364

被折叠的 条评论
为什么被折叠?



