
图像处理
文章平均质量分 57
图像处理
奋斗的牛马
这个作者很懒,什么都没留下…
展开
-
FPGA_YOLO(三)
上一篇讲的是完全映射,也就是block中的所包含的所有的卷积以及归一,池化卷积 举例总共6个等都在pl侧进行处理(写一个top 顶层 里面conv 1 bn1 relu1 pool1 conv1*1 conv 2 bn2 relu2 pool2 conv1*1 ....总共6个 ),最后在送给ps进行解码的。原创 2025-03-24 23:58:44 · 414 阅读 · 0 评论 -
FPGA_YOLO(二)
上述对cnn卷积神经网络进行介绍,接下来对YOLO进行总结,并研究下怎么在FPGA怎么实现的方案。对于一个7*7*30的输出 拥有49个cell 每一个cell都有两个bbox两个框,并且两个框所包含的信息拥有30个 4个坐标信息和一个置信度5个,剩下就是20个类别。原创 2025-03-24 15:51:47 · 808 阅读 · 0 评论 -
FPGA_YOLO学习(一)
卷积核:是一个小的权重矩阵,用于在局部区域内提取特征。神经元:是一个计算单元,接受输入并输出一个值。常用的卷积计算公式输入图片的尺寸:一般用n×n表示输入的image大小。卷积核的大小:一般用f×f表示卷积核的大小。填充(Padding):一般用p来表示填充大小。步长(Stride):一般用s来表示步长大小。输出图片的尺寸:一般用0来表示。1.3.2 激励层但实际梯度下降中,sigmoid容易饱和、造成终止梯度传递,且没有0中心化。原创 2025-03-24 12:04:45 · 782 阅读 · 0 评论 -
FPGA_YOLOv3
正样本的选取 就是在这个标注框里面的中心点有很多个预测框,选取与图片的iou的最大值作为正样本。B为多少个候选框, 5为5个位置信息 C为多少个类别。原创 2025-03-03 23:35:39 · 151 阅读 · 0 评论 -
FPGA_YOLO V2(1)
这m个框就是对于每一个框,maxi ou就小于这个预值,这个预测的这个预测框。与所有这个物体的这个真实的框去算一个i ou,然后找到最大的i ou,最大的i ou仍然小于这个预值,那么我们就把它当做这个框,当做负样本。第二行呢,也就是预测框与先验框的损失,第三行呢是预测框负责预测物体,它的位置损失。嗯,第四行就是啊,预测物预测框负责预测物体,它的执行度损失。就是在前12800次迭代中,我们让我们的这个预测框与这个先验框。13*13的cell ,每个cell负责5个先验框的预测,先验框是提前设置好的。原创 2025-03-02 23:03:35 · 362 阅读 · 0 评论 -
FPAG_yolo v1(2)
四位位置信息 代表候选框的位置信息 第一位所选候选框的中芯点x 以及中心点的y (相对于候选框),所选候选框的w 和h (相对整个图像)。7*7*30 7*7=49 个网格单元 一个网格单元2个候选框 30 代表候选框的信息 4+1 4+1 +20。四位的位置信息和一位的置信度需要统一归一化的无量纲的数据。损失函数:中心点误差、置信误差,高度宽度误差、+20位类别信息 voc的20中类。一位的置信度 是否有物体。原创 2025-03-02 21:24:48 · 171 阅读 · 0 评论 -
FPGA_YOLO v1(1)
2.将特征框输入到网络结构中。3.对特征向量进行分类。4.使用非极大值抑制。原创 2025-02-28 21:04:58 · 116 阅读 · 0 评论