
图像处理
文章平均质量分 92
算法笔记
lemon
这个作者很懒,什么都没留下…
展开
-
YOLOv5算法笔记1
锚框预测是指在目标检测任务中使用预定义的一组框来尝试捕捉图像中可能包含目标的区域。输入原图大小为608x608大小,通过大小为32倍率的下采样之后,原图被分割为19x19的大小进行目标检测后得到三个边界框。每个边界框中的结果分别有位置信息,目标得分(置信度),分类得分。预测得到的输出特征图有两个维度是提取到的特征的维度,比如13x13,还有一个维度(深度)是Bx (5+C) 多尺度融合通过引入多个不同尺度的特征图,可以提供更全面的特征表示,从而改善目标检测的效果。1.3 目标检测过程。原创 2024-04-22 17:48:58 · 1984 阅读 · 1 评论 -
YOLO算法笔记2:架构与组件
具体地,输入会被转换如下: 原始输入形状为 [批大小, 通道数, 高度, 宽度] 转换后的形状为 [批大小, 通道数×4, 高度除以2, 宽度除以2]这意味着原始输入的高度和宽度会被缩小一半,而通道数会增加为原来的四倍。具体来说,SPP网络通过在不同层次上对输入图像进行不同大小的池化操作,生成固定大小的特征向量,这样无论输入图像的尺寸如何,都能够得到固定大小的特征表示。而yolov5m的Focus结构中的卷积操作使用了48个卷积核,因此Focus结构后的特征图变成320x320x48。原创 2024-04-26 22:22:17 · 581 阅读 · 1 评论 -
Deepsort算法笔记
DeepSORT是一种目标跟踪算法,它结合了深度学习和卡尔曼滤波的技术。它最初是用于多目标跟踪的深度学习版本。通过结合卷积神经网络(CNN)和卡尔曼滤波,DeepSORT可以实现在视频中准确跟踪多个对象,并且能够在对象出现遮挡或者丢失的情况下继续跟踪。DeepSORT是SORT(Simple Online and Realtime Tracking)算法的扩展,它将深度学习D技术引入了传统的多目标跟踪框架中,以提高准确性和稳定性。原创 2024-04-26 22:25:09 · 1966 阅读 · 3 评论