深度学习工程实践 6. 使用pytorch训练自己的眼球分割模型

本文介绍了使用PyTorch实现眼球分割的工程实践,包括数据准备、标注、模型训练以及将训练结果部署到libtorch。通过手动标注大量眼部图片,利用U-Net模型进行训练,并对比了CPU与GPU的训练效率。最终,成功将模型应用到桌面程序中。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

深度学习工程实践 6. 使用pytorch训练自己的眼球分割模型

1. 概述

眼球分割,如果是在特定的眼球拍摄场景下,实际上直接用Opencv固定参数的方法就能够达到非常准确的识别率,但是,对任意的人像图片要达到准确的效果,Opencv固定参数的方法就要失效了。

这时候就考虑使用U-net来进行训练和分割了。

2. 目标

  • 使用pytorch实现眼球分割训练,并将训练好的结果部署到libtorch上

3. 工程实践

主要步骤:

  • 找到眼睛数据
  • 标注眼球mask图
  • 图片修改到指定大小(224x224)
  • 训练
  • 验证结果

3.1 数据寻找,数据标注

其实主要的步骤,都是在组织数据。 要训练一个前人没有训练过的模型,数据清洗真的是一个非常痛苦的事情。 我在谷歌上下载了120张左右的眼睛图片,然后一张一张使用PS(微软的paint.net非常推荐,小巧快捷)进行收工标注,这个过程,都是手工活。 要快一点的化,下载和命名等,都使用了批量化工具,下载用的批量工具是chrom的一个扩展应用,图片批量助手,批量转换文件格式以及大小,使用的是XConvert这个工具。经过将近半天的忙活,得到了如下的数据集:

收集到的眼球图片
然后是痛苦的,一张一张的标注:

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值