
计算机视觉
文章平均质量分 65
程序之巅
仰天大笑出门去,我辈岂是蓬蒿人
展开
-
CVAT团队标注
团队标注工具原创 2025-01-05 14:21:43 · 205 阅读 · 0 评论 -
RK3588 开发板上根文件系统导出并制作img镜像
RK3588开发板镜像制作原创 2024-08-28 15:44:25 · 349 阅读 · 0 评论 -
vs2017配置opencv详细教程
参考https://blog.youkuaiyun.com/weixin_42450976/article/details/125749045。原创 2023-12-01 11:37:16 · 238 阅读 · 0 评论 -
win10+VS2017+OpenCV3.4.1+yolov4详细说明
参考链接:https://zhuanlan.zhihu.com/p/655438751。win10+VS2017+OpenCV3.4.1+yolov4详细说明。原创 2023-11-30 16:35:01 · 171 阅读 · 0 评论 -
Detectron2 入门
本文简要介绍detectron2中内置命令行工具的使用预训练模型的推理演示从Model Zoon里面选择一个模型以及配置文件,例如mask_rcnn_R_50_FPN_3x.yaml运行这个命令python demo.py --config-file ../configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml --input jiejin.jpg --opts MODEL.WEIGHTS detectron2://COCO-Inst原创 2022-03-02 11:34:42 · 2975 阅读 · 0 评论 -
Two Stage Detection
Fast R-CNN利用selective search方式得到近似2000个RoI区域Deep ConvNet原始整张图片进行一次全部卷积RoI projection原始ROI到卷积后的feature map的映射,根据原始图片大小和整个图片的feature map大小可以得到一个缩放的比例。由于ROI尺寸在缩放后,可能存在非整数情况,这样就需要向下取整操作,导致像素偏移。这是第一次量化误差。RoI pooling layer将不同大小的feature map变成相同大小。原创 2022-02-16 11:03:49 · 1838 阅读 · 0 评论 -
nms,soft nms算法理解
从上面这张图可以看出来nms和soft nms的算法原理:**经典nms的原理**设定目标框的置信度阈值,常用的阈值是0.5左右根据置信度降序排列候选框列表 选取置信度最高的框A添加到输出列表,并将其从候选框列表中删除 计算A与候选框列表中的所有框的IoU值,删除大于阈值的候选框(大于阈值的候选框,表示与置信度最高的勾选框高度重合,所以认为是一个候选框了)重复上述过程,直到候选框列表为空,返回输出列表**由此可见,经典nms主要是通过IoU来筛选出候选框。SoftNMS原理**找到.原创 2022-02-15 16:47:38 · 4736 阅读 · 1 评论 -
yolov5 nms 源码理解
直接放入nms yolov5源码,以一个二分类的模型举例说明,对nms的理解def non_max_suppression(prediction, conf_thres=0.25, iou_thres=0.45, classes=None, agnostic=False, multi_label=False, labels=(), max_det=100000,return_index = False): """Runs Non-Maximum Su原创 2022-01-29 18:39:12 · 8665 阅读 · 2 评论 -
YOLOv5 Unable to find a valid cuDNN algorithm to run convolution
YOLOv5遇到的bug处理方法当我们测试yolov5l.pt这个模型进行预训练的时候,会报Unable to find a valid cuDNN algorithm to run convolution这个错误,当你重新安装cudnn后仍然不能解决问题。其实这个问题很简单,并不是我们的cudnn出问题了。而是,由于yolov5l属于大模型。显存可能不足,这时候只需调小batch_size即可。...原创 2021-12-30 14:06:37 · 1368 阅读 · 0 评论 -
滤波的概念和作用
图像滤波增强处理实质上就是运用滤波技术来增强图像的某些空间频率特征,以改善地物目标与领域或背景之间的灰度反差。遥感系统成像过程中可能产生的”模糊”作用,常使遥感图像上某些用户感兴趣的线性形迹、纹理与地物边界等信息显示得不够清晰,不易识别。需要通过采用领域处理方法来分析、比较和调整像元与其周围相邻像元间的对比度关系,图像才能得到增加,也就是说需要采用滤波增加技术处理。 一,空域滤波:使用空域卷积模板进行的图像处理,模板本身被称为空域滤波器。 (一)线性滤波器:是线性系统和频域滤波概念在空域原创 2021-12-09 07:01:40 · 6953 阅读 · 0 评论 -
迁移学习举例
1. 迁移学习背景随着越来越多的机器学习应用场景的出现,监督学习需要大量的标注数据,标注数据是一项枯燥无味且花费巨大的任务,所以迁移学习受到越来越多的关注。实际项目中没有那么多样本。在实际的解决问题中很少有人从头至尾搭建一个完全新的模型。一般从Github上找和自己问题相似的场景,直接使用已有的网络结构,在上面修改,然后应用于解决实际问题。Pytorch和Tf有很多内置的经典模型,在Imagnet,coco等数据集上训练好的模型参数,所以我们可以不仅复用这些网络结构,还会复用参数。固定绝大多数参原创 2021-11-14 16:15:54 · 2807 阅读 · 0 评论 -
Numpy 如何高效的拆分图片
在很多情况下,您需要将大图像分解为切片(例如作为 ML 预处理管道的一部分)以进行批处理。本文旨在探索在 Python 中执行此操作的较低级别方法。嵌套 for 循环:效率低下的方式。我见过的最常见的创建图像图块堆栈的方法之一是使用嵌套的 for 循环,例如实例化具有所需维度的新数组并将其填充在这些循环中。然而,这种方法在 Python 中效率特别低(尤其是),并且根本不能很好地扩展,对于大型数据集(也不是较小的瓦片,就此而言)。嵌套的 for 循环方法类似于下面的代码片段:# Nested f原创 2021-11-09 18:06:49 · 1595 阅读 · 0 评论 -
深入理解Detectron 2 — Part5 ROI (Box) Head
本文翻译自博客https://medium.com/@hirotoschwert/digging-into-detectron-2-part-5-6e220d762f9Figure 1. Inference result of Faster (Base) R-CNN with Feature Pyramid Network.嗨,我是计算机视觉研究员 Hiroto Honda¹[homepage] [twitter] 在这篇文章中,我想分享我对 Detectron 2 的了解——repo 结构..原创 2021-07-27 16:06:40 · 4703 阅读 · 0 评论 -
深入理解Detectron 2 — Part 4 区域建议网络(Region Proposal Network)
Figure 1. Inference result of Faster (Base) R-CNN with Feature Pyramid Network.嗨,我是计算机视觉研究员 Hiroto Honda¹[homepage] [twitter] 在这篇文章中,我想分享我对 Detectron 2 的了解——repo 结构、构建和训练网络、处理数据集等等。 2019 年,我使用Detectron 2所基于的 maskrcnn-benchmark 在 Open Images 竞赛 (ICCV 2...原创 2021-07-25 22:43:57 · 4311 阅读 · 2 评论 -
如何将标注格式从 PASCAL VOC XML 转换为 COCO JSON
本文参考与https://blog.roboflow.com/how-to-convert-annotations-from-voc-xml-to-coco-json/计算机视觉问题需要带标注的数据集。随着object detection的发展,出现了描述对象标注不同文件格式。这造成了令人沮丧的情况,团队将时间花在从一种标注格式转换为另一种标注格式上,而不是专注于更高价值的任务——比如改进深度学习模型架构。数据科学家花费时间在注释格式之间进行转换就像作者花费时间将 Word 文档转换为 PDF。最常用的原创 2021-07-23 11:50:34 · 2244 阅读 · 1 评论 -
实战Detectron2— 训练人体关键点检测
python train_net.py --config-file ./configs/COCO-Keypoints/keypoint_rcnn_R_101_FPN_3x.yamlSOLVER.IMS_PER_BATCH 2 SOLVER.BASE_LR 0.0025原创 2021-07-19 06:00:43 · 8146 阅读 · 3 评论 -
深入理解Detectron 2 — Part 3 数据加载器和Ground Truth实例(Data Loader and Ground Truth Instances)
本文翻译自博客:Digging into Detectron 2 — part 3 | by Hiroto Honda | MediumFigure 1. Inference result of Faster (Base) R-CNN with Feature Pyramid Network.嗨,我是计算机视觉研究员 Hiroto Honda¹[homepage] [twitter] 在这篇文章中,我想分享我对 Detectron 2 的了解——repo 结构、构建和训练网络、处理数据集等等。.原创 2021-07-18 13:40:22 · 1309 阅读 · 2 评论 -
深入理解Detectron 2 — Part 2 特征金字塔网络(Feature Pyramid Network)
本文翻译自博客:Digging into Detectron 2 — part 2 | by Hiroto Honda | MediumFigure 1. Inference result of Faster (Base) R-CNN with Feature Pyramid Network.嗨,我是计算机视觉研究员 Hiroto Honda¹[homepage] [twitter] 在这篇文章中,我想分享我对 Detectron 2 的了解——repo 结构、构建和训练网络、处理数据集等等。.原创 2021-07-18 10:17:59 · 4523 阅读 · 3 评论 -
深入理解Detectron 2 — Part 1 基础网络架构和代码库结构(Basic Network Architecture and Repo Structure)
什么是Detectron2? Detectron2 是 Facebook AI Research 的下一代开源对象检测系统。通过github上开源的存储库 ,您可以使用和训练各种最先进的模型来执行检测任务,例如边界框检测、实例和语义分割以及人体关键点检测。 您可以按照存储库的说明运行演示 — [安装] 和 [入门] — 但如果您想更进一步,而不仅仅是运行示例命令,则有必要了解该存储库的工作原理。Faster R-CNN FPN 架构作为示例,我选择具有特征金字塔网络³ (Bas...原创 2021-07-15 17:00:12 · 4927 阅读 · 0 评论 -
SLAM到底是什么?一文带你读懂SLAM
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、SLAM到底是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言近年来,SLAM导航技术已取得了很大的发展,它将赋予机器人和其他智能体前所未有的行动能力,而激光SLAM与视觉SLAM必将在相互竞争和融合中发展,使机器人从实验室和展厅中走出来,做到真正的服务于人类。提示:以下是本篇文章正文内容,下面案例可供参考一、SLAM到底是什么?SLAM是Simultaneo..原创 2021-06-25 06:38:23 · 5324 阅读 · 1 评论 -
YOLOV3 原理
YOLOV3论文翻译https://zhuanlan.zhihu.com/p/83218931原创 2021-03-12 18:02:10 · 1588 阅读 · 0 评论 -
深度学习数据增强方法,透视变换原理以及实例代码详解
导读在上篇文章中,我们介绍了仿射变换,我们只需要通过一个两行三列的变换矩阵M就能够对图像实现平移、缩放、翻转、旋转操作。我们发现这些变换其实都属于平面变换,如果我们想要进行空间变换呢?将上图的扑克牌单独提取出来,如下图所示这时候我们应该如何来实现这个功能呢?这个其实就涉及到了图像的一个空间变换,就需要用到我们所说的透视变换了。透视变换透视变换(Perspective Transformation)是指利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一原创 2021-02-16 23:08:51 · 13011 阅读 · 0 评论 -
深度学习数据增强方法,利用仿射变换实现图像进行各种操作如平移、缩放、旋转、翻转
导读在图像处理中,我们经常需要对图像进行各种操作如平移、缩放、旋转、翻转等,这些其实都是图像的仿射变换。通过本篇文章,你能够知道它们的实现原理以及如何应用它们。仿射变换仿射变换也称仿射投影,是指几何中,对一个向量空间进行线性变换并接上一个平移,变换为另一个向量空间。所以,仿射变换其实也就是在讲如何来进行两个向量空间的变换假设有一个向量空间k:k=(x,y)k=(x,y)k=(x,y)还有一个向量空间j:j=(x′,y′)j=(x',y' )j=(x′,y′)如果我们想要将向量空间由k变为j,原创 2021-02-15 11:21:55 · 14022 阅读 · 3 评论 -
SIFT算法实现图片匹配
SIFT (Scale-Invariant Feature Transform)是David Lowe 在1999发明的一种算法。它在世界范围内,作为图像对齐和对象识别的参考方法。此方法的鲁棒性能够检测场景的不同比例、角度和照明的因素。silx 中可用的实现使用 OpenCL,这意味着它可以在图形处理单元 (GPU) 和中央处理单元 (CPU) 上运行。在图像中检测到有趣的点(关键点),然后提取称为描述符的数据结构,即场景的特征,以便同一场景的两个不同的图像显示类似的描述符。描述符对转换(如平移、旋转、重新原创 2020-11-22 06:45:41 · 10712 阅读 · 1 评论