听师姐提到一种特征描述子:对图像中每个3*3的块进行一定的处理,之后用矩阵外周8个像素表示此块,每个像素点有0和1两种状态。于是总共有2的8次方即256种状态。但通过一定的分类规则,可以把256种状态分为36种。比如以下两个图:
由于左图可以通过旋转变为右图,所以认为他们是同一种状态。
感觉这个方法很简单,也有一定道理,分类的标准一定程度保证了“旋转不变性”。很有意思,于是自己试着实现了一下。
假设用一个1*8的向量表示特征,向量中每个数分别表示特征中从左上角开始,顺时针每个像素的标识。如上图两个特征可以表示为:
通过对向量中的元素进行循环移位,两个向量均可移位成为以下的形式:
即所有移位结果中表示的最小的数。
可以利用标准模块库中的bitset<>实现特征的表示和移位操作:
int Original_to_Sets(int long_num)
{
bitset<8> bit_num(long_num);
int shift_min=long_num;
for(int n=0;n<8;n++){
int first_bit=bit_num[7];
for(int i=7;i>0;i--){
bit_num[i]=bit_num[i-1];
}
bit_num[0]=first_bit;
int shift_tmp=bit_num.to_ulong();
if(shift_tmp<shift_min){
shift_min=shift_tmp;
}
}
return shift_min;
}
用一个向量original_nums记录原始的256中情况,另一个向量set_nums对应记录每种情况移位为最小值时的情况:
int main(){
vector<int>original_nums;
vector<int> set_nums;
vector<int> sets;
int nums=256;
for(int i=0;i<nums;i++){
original_nums.push_back(i);
int shift_num=Original_to_Sets(i);
set_nums.push_back(shift_num);
bool exist=false;
for(vector<int>::iterator it=sets.begin();it!=sets.end();it++){
if(*it==shift_num)
exist=true;
}
if(!exist)
sets.push_back(shift_num);
}
cout<<"There are "<<sets.size()<<" kinds"<<endl;
for(vector<int>::iterator it=sets.begin();it!=sets.end();it++){
bitset<8> bit_num(*it);
cout<<bit_num<<endl;
for(int i=0;i<256;i++){
if(*it==set_nums[i])
cout<<original_nums[i]<<" ";
}
cout<<endl;
}
return 0;
}
最终256中特征被分为36种: