现代CPU由于存在多级流水线,对于分支处理又存在分支预测功能,因此在实际cpu的运行过程中,beq指令的周期不是固定的。
另外,即使对于其他指令,比如lw指令,其指令周期也不是固定的。取决于该指令跟后面的指令有没有依赖关系。 使用2周期的那些lw指令的bne指令都是需要用到前一条lw指令的结果,所以必须等前一条完成之后才能执行。比如 lw a0,1540(t1)与bne a0,x0,-1,bne指令必须等 a0 的 load 结果出来之后才能开始执行。lw 本身都是4周期的,如果前后没有依赖关系就可以pipeline起来,看起来就是一个周期完成一样。比如图中前面那些1个周期的lw指令都是没有依赖关系的。另外,lw 周期数跟具体实现有关系,最少2周期,如果存储接口插入了等待周期会更长,具体到某个指令多少得分析微架构。所以说,并不能直接从代码段知道一个函数的实际运行时间,需要实际运行看看。
执行一个小程序进行测试(测试cpu为8级流水线),从log中获知一共使用了31个不同的指令。指令和指令次数为:
1, 跳转和返回指令
jal指令:
即使没有依赖关系,也是最少5周期:本测试一共有2983个jal指令,其指令周期和次数有: