
# 主要贡献
采用双路网络,先进行语义分割,后对分割后的图像进行静态手势判定。
主要优势:只需RGB图像即可,采用CNN,可以在各种干扰环境下达到经典算法的识别率。
借助离线+在线数据扩增,以及简易的网络结构,在很小的训练资源及计算代价下达到经典的效果。

# 网络结构
语义分割网络借鉴FCN的思路,采用ResNet的结构,结合Atrous Convolution扩大视野,进行语义分割。
分割阶段的网络结构细节


识别阶段的网络结构

# 训练方法
通用的方法,采用三阶段训练法。
输入包含 原图(RGB

本文介绍了HGRNet,一个仅使用RGB图像的静态手势识别网络。通过语义分割预处理,结合双路网络结构实现高识别率。网络采用ResNet和Atrous Convolution,通过离线和在线数据扩增降低训练资源和计算成本。训练分为三个阶段,包括分割网络、stream network和fusion network的训练。实验结果显示,HGRNet在准确性、模型大小和实时性方面具有优势,适合低成本终端部署。
最低0.47元/天 解锁文章
9299

被折叠的 条评论
为什么被折叠?



