SVM（一）

最新推荐文章于 2021-03-19 16:34:11 发布

转载最新推荐文章于 2021-03-19 16:34:11 发布 · 475 阅读

文章标签：

#opencv

opencv 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了一个使用HOG+SVM进行手写数字识别的项目。通过VS2010和OpenCV2.4.3实现从MNIST数据集中训练分类器，并演示了如何加载训练好的模型进行单张图片的手写数字预测。

http://blog.youkuaiyun.com/candyforever/article/details/8564746

使用工具：VS2010 + OpenCV 2.4.3

手写数字库：http://code.google.com/p/supplement-of-the-mnist-database-of-handwritten-digits/downloads/list

Hog +SVM 训练10K个图片数据得到分类器：HOG_SVM_DATA.xml 整个过程大概需要5分钟左右，看个人电脑配置，若想提高正确率增大训练样本！

有关批处理的命令见下一篇博客，大家共同学习！

[cpp]view plaincopy 
   
 #include "stdafx.h"  
 #include "opencv2/opencv.hpp"  
 #include "windows.h"  
 #include "fstream"  
 using namespace std;  
 using namespace cv;  
 int _tmain(int argc, _TCHAR* argv[])  
 {  
     vector<string> img_path;//输入文件名变量     
     vector<int> img_catg;      
     int nLine = 0;      
     string buf;      
     ifstream svm_data( "D:/nums/hb.txt" );//训练样本图片的路径都写在这个txt文件中，使用bat批处理文件可以得到这个txt文件       
     unsigned long n;       
     while( svm_data )//将训练样本文件依次读取进来      
     {      
         if( getline( svm_data, buf ) )      
         {      
             nLine ++;      
             if( nLine % 2 == 0 )//注：奇数行是图片全路径，偶数行是标签   
             {      
                  img_catg.push_back( atoi( buf.c_str() ) );//atoi将字符串转换成整型，标志(0,1，2，...，9)，注意这里至少要有两个类别，否则会出错      
             }      
             else      
             {      
                 img_path.push_back( buf );//图像路径      
             }      
         }      
     }      
     svm_data.close();//关闭文件      
     CvMat *data_mat, *res_mat;      
     int nImgNum = nLine / 2; //nImgNum是样本数量，只有文本行数的一半，另一半是标签       
     data_mat = cvCreateMat( nImgNum, 324, CV_32FC1 );  //第二个参数，即矩阵的列是由下面的descriptors的大小决定的，可以由descriptors.size()得到，且对于不同大小的输入训练图片，这个值是不同的    
     cvSetZero( data_mat );      
     //类型矩阵,存储每个样本的类型标志      
     res_mat = cvCreateMat( nImgNum, 1, CV_32FC1 );      
     cvSetZero( res_mat );      
     IplImage* src;      
     IplImage* trainImg=cvCreateImage(cvSize(28,28),8,3);//需要分析的图片，这里默认设定图片是28*28大小，所以上面定义了324，如果要更改图片大小，可以先用debug查看一下descriptors是多少，然后设定好再运行      
       
     //处理HOG特征    
     for( string::size_type i = 0; i != img_path.size(); i++ )      
     {      
             src=cvLoadImage(img_path[i].c_str(),1);      
             if( src == NULL )      
             {      
                 cout<<" can not load the image: "<<img_path[i].c_str()<<endl;      
                 continue;      
             }      
       
             cout<<" 处理： "<<img_path[i].c_str()<<endl;      
                      
             cvResize(src,trainImg);       
             HOGDescriptor *hog=new HOGDescriptor(cvSize(28,28),cvSize(14,14),cvSize(7,7),cvSize(7,7),9);        
             vector<float>descriptors;//存放结果       
             hog->compute(trainImg, descriptors,Size(1,1), Size(0,0)); //Hog特征计算        
             cout<<"HOG dims: "<<descriptors.size()<<endl;          
             n=0;      
             for(vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)      
             {      
                 cvmSet(data_mat,i,n,*iter);//存储HOG特征   
                 n++;      
             }         
             cvmSet( res_mat, i, 0, img_catg[i] );      
             cout<<" 处理完毕: "<<img_path[i].c_str()<<" "<<img_catg[i]<<endl;      
     }      
           
                    
     CvSVM svm = CvSVM();//新建一个SVM        
     CvSVMParams param;//这里是SVM训练相关参数    
     CvTermCriteria criteria;        
     criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );        
     param = CvSVMParams( CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );            
       
     svm.train( data_mat, res_mat, NULL, NULL, param );//训练数据       
     //保存训练好的分类器        
     svm.save( "HOG_SVM_DATA.xml" );    
          
    //检测样本      
     IplImage *test;    
     char result[512];   
     vector<string> img_tst_path;  
     ifstream img_tst( "D:/SVM_TEST.txt" );  //加载需要预测的图片集合，这个文本里存放的是图片全路径，不要标签  
     while( img_tst )    
     {    
         if( getline( img_tst, buf ) )    
         {    
             img_tst_path.push_back( buf );    
         }    
     }    
     img_tst.close();   
   
     ofstream predict_txt( "SVM_PREDICT.txt" );//把预测结果存储在这个文本中     
     for( string::size_type j = 0; j != img_tst_path.size(); j++ )//依次遍历所有的待检测图片      
     {      
         test = cvLoadImage( img_tst_path[j].c_str(), 1);      
         if( test == NULL )      
         {      
             cout<<" can not load the image: "<<img_tst_path[j].c_str()<<endl;      
             continue;      
         }  
         IplImage* trainTempImg=cvCreateImage(cvSize(28,28),8,3);  
         cvZero(trainTempImg);      
         cvResize(test,trainTempImg);      
         HOGDescriptor *hog=new HOGDescriptor(cvSize(28,28),cvSize(14,14),cvSize(7,7),cvSize(7,7),9);         
         vector<float>descriptors;//结果数组         
         hog->compute(trainTempImg, descriptors,Size(1,1), Size(0,0));       
         cout<<"HOG dims: "<<descriptors.size()<<endl;      
         CvMat* SVMtrainMat=cvCreateMat(1,descriptors.size(),CV_32FC1);      
          int n=0;      
         for(vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)      
         {      
                cvmSet(SVMtrainMat,0,n,*iter);      
                n++;      
         }      
       
         int ret = svm.predict(SVMtrainMat);//检测结果  
         sprintf( result, "%s  %d\r\n",img_tst_path[j].c_str(),ret );  
         predict_txt<<result;  //输出检测结果到文本  
     }  
         predict_txt.close();      
         cvReleaseMat( &data_mat );      
         cvReleaseMat( &res_mat );    
         cvReleaseImage(&test);  
         cvReleaseImage(&trainImg);  
         return 0;  
 }  

训练样本hb.txt文本内容大致如下（总共20000行，批处理得到如下数据）：

总共有10个标签，0到9

待预测文本内容如下（同样批处理得到）：

预测结果文本内容如下：

后面的数字是预测结果，正确率还可以。

训练好了分类器，以后就不要再训练了，直接加载分类器

[cpp]view plaincopy 
   
 #include "stdafx.h"  
 #include "opencv2/opencv.hpp"  
 #include "windows.h"  
 #include "fstream"  
 using namespace std;  
 using namespace cv;  
 int _tmain(int argc, _TCHAR* argv[])  
 {  
       
     CvSVM svm = CvSVM();  
     svm.load("HOG_SVM_DATA.xml");//加载训练好的xml文件，这里训练的是10K个手写数字  
     //检测样本      
     IplImage *test;    
     char result[300]; //存放预测结果   
     test = cvLoadImage("5.bmp", 1); //待预测图片，用系统自带的画图工具随便手写  
     if (!test)  
      {  
       MessageBox(NULL,TEXT("待预测图像不存在！"),TEXT("提示"),MB_ICONWARNING);  
       return -1;  
      }  
      IplImage* trainTempImg=cvCreateImage(cvSize(28,28),8,3);  
      cvZero(trainTempImg);      
      cvResize(test,trainTempImg);       
      HOGDescriptor *hog=new HOGDescriptor(cvSize(28,28),cvSize(14,14),cvSize(7,7),cvSize(7,7),9);        
      vector<float>descriptors;//存放结果         
      hog->compute(trainTempImg, descriptors,Size(1,1), Size(0,0)); //Hog特征计算        
      cout<<"HOG dims: "<<descriptors.size()<<endl;  //打印Hog特征维数  ，这里是324  
      CvMat* SVMtrainMat=cvCreateMat(1,descriptors.size(),CV_32FC1);     
      int n=0;      
      for(vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)      
      {      
            cvmSet(SVMtrainMat,0,n,*iter);      
            n++;      
       }     
       
       int ret = svm.predict(SVMtrainMat);//检测结果  
       sprintf(result, "%d\r\n",ret );  
       cvNamedWindow("dst",1);  
       cvShowImage("dst",test);  
       MessageBox(NULL,result,TEXT("预测结果"),MB_OK);  
       cvReleaseImage(&test);  
       cvReleaseImage(&trainTempImg);  
       return 0;  
 }