基于深度学习的流浪猫识别网络应用
1 引言
流浪猫个体识别是一项耗时且繁琐的工作,借助深度学习模型可实现自动识别。本文将详细介绍如何构建流浪猫识别模型,以及开发相应的网络应用。
2 ResNet 与数据集
2.1 ResNet 简介
ResNet 是一种适用于训练深度网络的残差学习框架,它通过重构层来学习基于层输入的残差函数。残差网络易于优化,能提高因增加深度而获得的准确性,解决了梯度消失问题,因为梯度信号可借助捷径连接传播回前层,从而允许在网络中构建更多层。在本工作中,使用了不同层数的 ResNet(50 层 ResNet 和 101 层 ResNet),层数不同对模型的准确性和性能有影响。
2.2 数据集详情
- 数据来源 :所有图像基于热感应相机陷阱拍摄,相机在动物经过时触发。照片拍摄于维多利亚州农村的两个主要地点:奥特韦山脉和格伦埃尔格地区。相机陷阱分布在这些地点的多个网格中,每个网格有 70 - 110 台相机,运行 2 - 3 个月。
- 图像质量问题 :由于拍摄的是移动动物,许多图像质量较低,如模糊、只包含部分身体、猫重叠、过度曝光等。为解决此问题,选择了能展示每只猫不同侧面的高质量图像,将高质量照片少于 5 张的猫归为“其他”类。
- 数据预处理
- 数据不平衡处理 :部分流浪猫选定图像少于 10 张,而其他猫多于 50 张,数据集不平衡。采用数据增强方法,如旋转(将
超级会员免费看
订阅专栏 解锁全文
34

被折叠的 条评论
为什么被折叠?



