本节开始,进入resnet50 的第 5 部分优化:代码生成,对应的代码目录在 5th_codegen 下。
什么是代码生成
先看个例子,假设要实现如下功能:对两个等长的数组,将第一个数组中数值为偶数的数与第二个数组中对应位置的数相加,得到一个新的数组,其余位置设为0。
正常情况下,可以用 c++ 写出如下代码:
int v1[5] = {1, 2, 4, 5, 6};
int v2[5] = {11, 12, 14, 15, 16};
int res[5] = {0};
for (int i = 0; i < 5; i++) {
if (v1[i] % 2 == 0) { // 判断是否是偶数
res[i] = v1[i] + v2[i]; // 如果为偶数则相加
}
}
这样写没问题,但是深入分析就可以看到,数组中 index 为0 和 3 的位置为奇数,只有1,2,4的位置为偶数,相加操作仅计算 index = 1,2,4 的位置即可。
如果有一种办法,可以事先知道数组中需要计算的下标索引 index,那么就可以写出如下代码:
int v1[5] = {1, 2, 4