指静脉识别 Deep Learning
一、总体架构
1.1 预处理——Preprocessing
在将指静脉图像输入神经网络中进行特征提取之前,首先使用 ROI(region of interest) 提取和高斯滤波进行预处理。ROI提取主要用于对齐手指的中心线并滤除背景,有利于更稳定的识别。在ROI提取中,首先使用二阶中心矩方法来计算像素方向强度,最大响应将出现在手指边缘,然后采用水平 Gabor 滤波器来确保后续的固定阈值二值化可以更鲁棒地确定边缘。此外,使用二次曲线拟合来消除由图像质量引起的噪声和边缘破损。最后通过将手指的中心线旋转到水平位置来对齐图像,并从图像的中心区域裁剪出 ROI。
1.2 U-Net——静脉模式提取
首先通过基于二阶中心矩的传统方法获得精细的静脉图案。静脉图案进一步通过高斯核进行滤波,然后作为软标签信息来监督 U-Net 的训练。也就是说每个像素的归一化灰度级被视为其包含静脉的概率。
这里引入Dice系数和Binary Cross Entropy (BCE) loss来作为总的损失函数:
其中 s 表示为进一步平滑标签而引入的平滑因子。
这里使用一种修改后的U-Net,即compressed U-Net,框架如下所示:
修改后的架构的设计如图所示。与原始U-Net相比,具有跳跃连接的编码器解码器块减少了一层,并且特征图的所有通道减少了四分之一。16、32、64、128作为水平编码器-解码器块的中间特征图的通道,其中128是Bottleneck的输出维度。最后的1×1卷积和sigmoid层将所有16维向量映射到每个像素的类别概率。
1.3 GA——图像增强
1.4 Thinning——骨架提取
1.5 AKAZE——特征点检测
1.6 RANSAC——匹配
to be continue
生活不易,但别放弃