(1)数据采集
显然,数据的采集是进行生物识别验证的前提条件。一个性能良好的生物特征识别系统一定需要首先捕获到好的生物特征数据。利用这些数据,我们就可以进行后续的预处理、特征提取、特征选择等工作。一般来说,这里的数据采集肯定需要借助相应的硬件设备,诸如,声音传感器、图像传感器等等。如果传感器的灵敏度不高,或者传感器的精确度不高,那么势必会对所采集到的数据产生一定的噪声污染。这样一来,尽管可以通过后续的预处理来减弱甚至消除一部分噪声,但是,终究无法做到完全去除噪声的干扰。所以,数据采集部分应该尽量保证所得到的数据纯正、干净。通常我们可以采集相当数量的数据,并从中选择最优、最好、最具有代表性的数据来作为原始的输入。这样,就从源头上保证了数据取样对最终生物识别验证系统的干扰最小。
另外,需要注意的是,针对不同的生物特征,数据采集的方法和原理是不同的。比如,虹膜识别系统是通过分析人的虹膜表面不同区域不同的纹理分布来进行分类辨别的。而掌纹识别,则是基于人的手掌脉络的不同分叉、线条的粗细等特征为依据来进行最终的识别。笔迹识别则是利用了不同的人在签名时笔划的长度、角度、偏移,握笔的力度、书写时的速度,加速度等特征来进行区分的。
(2)预处理
在基于统计方法的生物识别技术领域,所谓的预处理一般是指去除噪声的干扰,加强有效信息的过程。前面已经提到,原始数据的采集不可避免的要引入一些噪声的干扰,对于一个实际的生物识别系统而言,预处理是一个必要的环节。但是,需要注意的是,虽说预处理的作用都是减弱甚至消除噪声的干扰,同时增强有用信息的强度,不过,针对不同的特征,预处理的方法也是千差万别。
(3)特征提取
一般来说,从传感器得到的数据属于原始测量空间的数据,而原始测量空间的数据是无法直接进行判别分类的,或者说,直接利用原始测量空间得到的数据进行判别分类往往达不到期望的效果。通常来说,我们需要将数据从原始的测量空间“变换”到二次空间,而这个二次空间,研究人员一般将它称为特征空间。将数据从原始空间变换到特征空间后,我们就得到了表征某模式的二次特征,一般我们所指的特征就是这里所谓的二次特征。
(4)特征选择
数据从原始空间变换到特征空间后,得到了二次特征,而这里的二