深度学习工程实践 6. 使用pytorch训练自己的眼球分割模型

最新推荐文章于 2023-12-09 08:30:00 发布

原创

最新推荐文章于 2023-12-09 08:30:00 发布

· 1.8k 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #liborch

本文介绍了使用PyTorch实现眼球分割的工程实践，包括数据准备、标注、模型训练以及将训练结果部署到libtorch。通过手动标注大量眼部图片，利用U-Net模型进行训练，并对比了CPU与GPU的训练效率。最终，成功将模型应用到桌面程序中。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

深度学习工程实践 6. 使用pytorch训练自己的眼球分割模型

1. 概述
2. 目标
3. 工程实践
4. 总结

1. 概述

眼球分割，如果是在特定的眼球拍摄场景下，实际上直接用Opencv固定参数的方法就能够达到非常准确的识别率，但是，对任意的人像图片要达到准确的效果，Opencv固定参数的方法就要失效了。

这时候就考虑使用U-net来进行训练和分割了。

2. 目标

使用pytorch实现眼球分割训练，并将训练好的结果部署到libtorch上

3. 工程实践

主要步骤:

找到眼睛数据
标注眼球mask图
图片修改到指定大小(224x224)
训练
验证结果

3.1 数据寻找，数据标注

其实主要的步骤，都是在组织数据。要训练一个前人没有训练过的模型，数据清洗真的是一个非常痛苦的事情。我在谷歌上下载了120张左右的眼睛图片，然后一张一张使用PS(微软的paint.net非常推荐，小巧快捷)进行收工标注，这个过程，都是手工活。要快一点的化，下载和命名等，都使用了批量化工具，下载用的批量工具是chrom的一个扩展应用，图片批量助手，批量转换文件格式以及大小，使用的是XConvert这个工具。经过将近半天的忙活，得到了如下的数据集:

收集到的眼球图片
然后是痛苦的，一张一张的标注:

最低0.47元/天解锁文章

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。