- 博客(5)
- 收藏
- 关注
原创 深度学习之分割任务
30个类别,5000张精细标注的图像(2975张训练图、500张验证图和1525张测试图)、20000张粗略标注的图像。,解决“每一个像素属于哪个目标物或场景”的问题,属于像素级的,需要给出属于每一类的所有像素点,而不是矩形框。将不同的像素划分到不同的类别,非常细粒度的分类。:只预测前景目标的类别属性以及边框,个体ID,每一个像素可以属于多个ID。人像抠图,医学组织提取,遥感图像分析,自动驾驶,材料图像等。事物Stuff:不可数背景(天空,草地,路面)。以场景理解为目标,特别选取比较复杂的日常场景。
2024-10-18 14:31:02
704
原创 YOLOv5
YOLO(You Only Look Once)系列是由Joseph Redmon等人在2016年首次提出的是一种目标对象检测算法。这一系列算法通过将对象检测视为单次回归问题,从输入图像直接预测对象边界框和类别,极大提高了检测速度。YOLO系列在其每个版本中都进行了改进和优化,逐步提升了精度和速度。1.配置好netron , 详情: https://git hub.com/lutzroeder/netron 桌面版: https://lutzroeder.github.io/netron/
2024-10-14 14:49:00
278
原创 深度学习之目标检测3
YOLO(You Only Look Once)系列是由Joseph Redmon等人在2016年首次提出的是一种目标对象检测算法。这一系列算法通过将对象检测视为单次回归问题,从输入图像直接预测对象边界框和类别,极大提高了检测速度。YOLO系列在其每个版本中都进行了改进和优化,逐步提升了精度和速度。为了提升准确度,可以针对训练过程进行一些优化,比如数据增强、类别不平衡、成本函数、软标注……YOLOv4 的开发历程很有意思,其中评估、修改和整合了很多有趣的新技术。分母是能覆盖预测框与真实框的最小BOX。
2024-10-12 15:59:35
1359
原创 深度学习之目标检测2
Yolov3将一些较好的检测思想(如残差网络、特征融合等)融入到Yolo,在保持速度优势的前提下,进一步提升了检测精度,尤其是对小物体检测的能力,达到了令人惊艳的效果和拔群的速度,如下图所示,是各种先进的目标检测算法在COCO数据集上测试结果。YOLO v2采用Darknet-19,其网络结构如下图所示,包括个卷积层和5个max pooling层,主要采用3×3卷积和1×1卷积,这里1×1卷积可以压缩特征图通道数以降低模型计算量 和参数,每个卷积层后使用BN层以加快模型收敛同时防止过拟合。
2024-10-11 14:21:53
947
原创 深度学习之目标检测
预测的 Bounding Box 与 Ground Truth 的交并比 (Intersection over Union,IoU,后续会详细介绍) 大于阈值 (e.g. 0.5) ,当有多个满足条件的预选框,则选择置信度最大的作为TP,其余的作为 FP。错误的正向预测(False Positive,FP):负样本被检测为正样本的数量,也称误报,预测的 Bounding Box 与 Ground Truth 的 IoU 小于阈值的检测框(定位错误)或者预测的类型与标签类型不匹配(分类错误)。
2024-10-10 14:38:08
930
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅