caffe之特征图可视化及特征提取

本文介绍测试图片输入网络后产生的特征图的可视化方法,在caffe的classification.cpp文件基础上修改添加可视化功能,编译后可打印各层输出特征图维度信息,还展示了conv1特征图可视化。此外,还提及将CNN作为特征提取器,提取特征向量送进SVM分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上一篇博客,介绍了怎么对训练好的model的各层权重可视化,这篇博客,我们介绍测试图片输入网络后产生的特征图的可视化

记得上篇中,我们是写了一个新的文件test.cpp,然后编译运行那个文件的,这是因为权重可视化,是不需要网络的前向传播,只要加载model就好了,而我们如果需要可视化特征图,那就必须进行网络的前向传播了,所以,这次,我们对caffe根目录下的examples/cpp_classification/classification.cpp文件基础上,进行修改,添加我们自己需要的功能(可视化),同样的,我们把这个文件拷贝过来,放在自己的某个文件夹下,假设取名依然为test.cpp,而我们要修改的,就是Predict函数,定位到Predict函数,在net_->Forward();后面加入以下代码:

 

 
  1. //打印出一张图片经过网络各层产出的各层输出

  2. cout<<"网络中的Blobs名称为:\n";

  3. vector<shared_ptr<Blob<float> > > blobs=net_->blobs(); //得到各层的输出特征向量

  4. vector<string> blob_names=net_->blob_names(); //各层的输出向量名字

  5. cout<<blobs.size()<<" "<<blob_names.size()<<endl;

  6. for(int i=0;i<blobs.size();i++){

  7. cout<<blob_names[i]<<" "<<blobs[i]->shape_string()<<endl;

  8. }

  9. cout<<endl;

编译该文件,编译命令参照上一篇博客,此时会打印出如下信息

 
  1. 网络中的Blobs名称为:

  2. 15 15

  3. data 1 3 227 227 (154587)

  4. conv1 1 96 55 55 (290400)

  5. pool1 1 96 27 27 (69984)

  6. norm1 1 96 27 27 (69984)

  7. conv2 1 256 27 27 (186624)

  8. pool2 1 256 13 13 (43264)

  9. norm2 1 256 13 13 (43264)

  10. conv3 1 384 13 13 (64896)

  11. conv4 1 384 13 13 (64896)

  12. conv5 1 256 13 13 (43264)

  13. pool5 1 256 6 6 (9216)

  14. fc6 1 4096 (4096)

  15. fc7 1 4096 (4096)

  16. fc8 1 1000 (1000)

  17. prob 1 1000 (1000)

可以看到,此时将每个层的输出特征图的维度信息都打印出来了,比如data层的输出是1 3 227 277,因为网络的输入图片是1个,3通道,尺寸是227*227;经过conv1层的输出是1 96 55 55,因为conv1层有96个卷积核,卷积核大小为11*11,步长为4,所以其输出的每个特征图的尺寸为(227-11)/4+1=55,所以特征图的尺寸也对应着1 96 55 55.

 

好了,我们接下来再输入一下代码,进行对经过conv1的特征图可视化,其尺寸是1 96 55 55,也就看出是96个55*55大小的灰度图

 

 
  1. //将测试图片经过第一个卷积层的特征图可视化

  2. string blobName="conv1"; //我们取经过第一个卷积层的特征图

  3. assert(net_->has_blob(blobName)); //为免出错,我们必须断言,网络中确实有名字为blobName的特征图

  4. shared_ptr<Blob<float> > conv1Blob=net_->blob_by_name(blobName); //1*96*55*55 断言成功后,按名字返回该 特征向量

  5. cout<<"测试图片的特征响应图的形状信息为:"<<conv1Blob->shape_string()<<endl; //打印输出的特征图的形状信息

  6. //和前面的博客一样,此时的特征向量是经过了ReLU激活函数的,范围在0~无穷大,我们为了可视化,仍然需要归一化到0~255

  7. //下面的代码,跟上一篇博客中是一样的

  8. float maxValue=-10000000,minValue=10000000;

  9. const float* tmpValue=conv1Blob->cpu_data();

  10. for(int i=0;i<conv1Blob->count();i++){

  11. maxValue=std::max(maxValue,tmpValue[i]);

  12. minValue=std::min(minValue,tmpValue[i]);

  13. }

  14. int width=conv1Blob->shape(2); //响应图的宽度

  15. int height=conv1Blob->shape(3); //响应图的高度

  16. int num=conv1Blob->shape(1); //个数

  17. int imgHeight=(int)(1+sqrt(num))*height;

  18. int imgWidth=(int)(1+sqrt(num))*width;

  19. Mat img2(imgHeight,imgWidth,CV_8UC1,Scalar(0)); //此时,应该是灰度图

  20.  
  21. int kk=0;

  22. for(int x=0;x<imgHeight;x+=height){

  23. for(int y=0;y<imgWidth;y+=width){

  24. if(kk>=num)

  25. continue;

  26. Mat roi=img2(Rect(y,x,width,height));

  27. for(int i=0;i<height;i++){

  28. for(int j=0;j<width;j++){

  29. float value=conv1Blob->data_at(0,kk,i,j);

  30. roi.at<uchar>(i,j)=(value-minValue)/(maxValue-minValue)*255;

  31. }

  32. }

  33. kk++;

  34. }

  35. }

  36. resize(img2,img2,Size(500,500));//进行显示

  37. imshow("2",img2);

  38. waitKey(0);


 

 

输入图片

特征图

 

会了这一点后,大家如果想将CNN单纯的当做特征提取器,可以将第一个全连接层的前一层的输出特征向量(比如这个网络,是pool5层的输出特征1*256*6*6=9216)提取出来,这是该图片经过CNN后的最初步的特征,当然如果觉得维度高,也可以提取出第一个全连接层的特征向量,这里是4096维,然后再送进泛化性能更好的分类器(如SVM)去分类识别,我用提取第一个全连接层的4096维特征试验了下SVM,在线性核下,分类效果大致相当。大家可以根据自己的需求去尝试。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值