基于手写文本图像与深度学习的职业识别及乳腺癌检测研究
手写文本图像职业识别
手写文本图像的分析在身份识别领域有着重要的应用,传统上有针对书写者验证和识别的研究。书写者验证是通过比较两份文档来判断是否为同一人书写,属于二分类问题;而书写者识别则是在包含已知书写者手写样本的大型数据库中搜索,以找出最可能的书写者,属于多分类问题。此前的研究中运用了多种分类器,如隐马尔可夫模型(HMM)、支持向量机(SVM)等,深度学习技术也因其能自动学习特征的优势,被应用于许多识别任务。
提出的工作
采用卷积神经网络(CNN)基于手写笔迹来识别书写者的职业。具体工作分为以下几个部分:
- 数据集获取 :从医学、工程、艺术和商业等机构收集了医生、教授(教师)、作家、工程师和艺术学生的手写数据集,并为每个职业的数据集进行了正确标注。对离线数据集图像进行预处理,先使用3×3的中值滤波器去除椒盐噪声,再进行全局阈值处理(阈值设为190),最后分离每行得到最终带有特定标签的图像。
- 提出的模型 :提出了一个用于离线手写笔迹职业识别的CNN模型。在训练时,选取400张图像,每个类别约80张。对于每个类别中的图像,裁剪出113×113的随机补丁并拼接在一起,使得每个拼接图像包含来自不同书写者但属于同一类别的手写数据集,有助于CNN模型提取每个职业内部的特征。创建大小为8的随机打乱批次,每个类别创建10个批次,共5个类别,即50个批次,再将这些批次随机打乱后输入CNN进行训练。
该模型与AlexNet类似,由以下层组成:
| 层类型 | 输出形状 |
| — | — |
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



