这几天需要自己写个loss层,因此把caffe源码研读了下,在此记录下经验,方便后人以及自己日后复习。
首先看看caffe前向传播的工作流程,即net.cpp中的ForwardFromTo函数:

可以看到,该函数通过一个for循环来对每一个layer执行前向传播传播。具体的传播函数在layer.hpp中可以找到:

可以看到在这个函数中,最主要的就是执行了Reshape和Forward_cpu函数,剩下的就是对数据的一些处理,我们暂时先不用管它。然后由于Reshape和Forward_cpu都是虚函数,都是由具体的子类来实现的,即softmax_loss_layer.cpp中。接下来我们仔细看看softmax_loss_layer.cpp:
namespace caffe { template <typename Dtype> void SoftmaxWithLossLayer<Dtype>::LayerSetUp( const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top) { LossLayer<Dtype>::LayerSetUp(bottom, top);
LayerParameter softmax_param(this