这篇博客讲的比较好:https://blog.youkuaiyun.com/yeler082/article/details/83278371
需要注意的是,在单独一个layer的backward,forward计算时,对应proto中的batch(即一次forwardbackward计算几张图片),寄存在batch个深度的data 与diff,这batch个都会对weigth_diff产生影响:
这个体现在conv_layer.cpp的Backward Forward的this→num_循环里