深度学习工程实践 6. 使用pytorch训练自己的眼球分割模型
1. 概述
眼球分割,如果是在特定的眼球拍摄场景下,实际上直接用Opencv固定参数的方法就能够达到非常准确的识别率,但是,对任意的人像图片要达到准确的效果,Opencv固定参数的方法就要失效了。
这时候就考虑使用U-net来进行训练和分割了。
2. 目标
- 使用pytorch实现眼球分割训练,并将训练好的结果部署到libtorch上
3. 工程实践
主要步骤:
- 找到眼睛数据
- 标注眼球mask图
- 图片修改到指定大小(224x224)
- 训练
- 验证结果
3.1 数据寻找,数据标注
其实主要的步骤,都是在组织数据。 要训练一个前人没有训练过的模型,数据清洗真的是一个非常痛苦的事情。 我在谷歌上下载了120张左右的眼睛图片,然后一张一张使用PS(微软的paint.net非常推荐,小巧快捷)进行收工标注,这个过程,都是手工活。 要快一点的化,下载和命名等,都使用了批量化工具,下载用的批量工具是chrom的一个扩展应用,图片批量助手,批量转换文件格式以及大小,使用的是XConvert这个工具。经过将近半天的忙活,得到了如下的数据集:
然后是痛苦的,一张一张的标注: