目标检测
文章平均质量分 88
Felaim
Hey, you're not a nobody. You're a somebody.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
检测中 Denoising Training (去噪训练) 怎么理解?
Denoising Training 的核心:生成带噪声的 GT:从真实 GT 添加随机噪声明确的监督信号:这些 noisy anchors 的目标是原始 GT增加正样本:所有 noisy anchors 都是正样本加速收敛:提供更好的训练信号不是真正的"去噪",而是"从噪声中恢复"噪声尺度需要仔细设计(位置大,尺寸小)使用 attention mask 控制不同 instances 的交互可以显著加速训练并提高性能就像给模型一些"模糊的答案"(带噪声的 GT)原创 2025-12-13 12:37:13 · 894 阅读 · 0 评论 -
检测中的Reference Point (参考点)怎么理解?
Reference Point 是3D 空间中的一个点特征采样的参考位置:用于从多视角图像特征图中采样特征回归的起始点:用于预测目标边界框的偏移量空间位置的编码:提供位置信息给 Transformer 的 attention 机制特性Sparse4DReference Point 形式单一 3D 点多个 Key Points数量1 个/query多个/anchor (如 9 个)初始化可学习参数从 anchor 生成更新方式逐层迭代更新随 anchor 一起更新采样方式。原创 2025-12-13 12:27:47 · 987 阅读 · 0 评论 -
Sparse4D 时序输入和 Feature Queue 详解
Sparse4D 使用时序融合机制来处理多帧数据,通过类管理时序实例和 feature queue。本文将详细解释时序输入和 feature queue 的结构。原创 2025-12-13 12:17:58 · 389 阅读 · 0 评论 -
Paper reading:CenterNet (Objects as Points)
CenterNet (Objects as Points)一、背景介绍先说下为啥要写着篇博客,这是2019年检测的一篇文章,非常的火,也非常的好用。就LZ目前接触的几个项目来说,基本上目标检测使用的都是CenterNet中这一套,DBFace,FairMOT等等一系列。可以看到如果检测能够做的很快很好,可以空下很多资源给其下游的应用,如安防、自动驾驶等任务中去。所以,对于现在AI可以落地的一些应用中,检测占了很大一部分的比例。这个结构为什么能够那么火呢?结论是它的速度很快并且精度也很高,所以用的小伙伴原创 2020-10-29 14:02:06 · 1088 阅读 · 0 评论 -
目标检测(1)--SSD(Single shot multibox detection) pytorch版本调试
代码准备代码下载地址:https://github.com/amdegroot/ssd.pytorch接下来按照README进行安装,LZ发现真的代码写的好的人,README写的清晰有条理,有些包括LZ在内,都没有养成规范书写 README文档,这个LZ会再接再厉的。1. 环境要求:主要是依赖PyTorch,使用的是Python3+,这个小伙伴就自己配置吧!2. 训练可视化第二步是训...原创 2019-07-26 14:00:39 · 1461 阅读 · 1 评论 -
Paper reading: SSD (Single Shot MultiBox Detector)
项目需求,也要入检测的坑啦,SSD早已久仰大名,却始终没有仔细阅读过,今天LZ就做个入门级的paper reading吧,毕竟入坑不久,道行尚浅,如果有理解的不合理的地方,还请小伙伴们批评指正。还有,小伙伴经常会私信我,说对应问题如何解决,其实每个人电脑配置包括安装都不一样,所以可能不能一一解答,望小伙伴们谅解,毕竟个人精力有限。当然这个方法算是比较经典的算法,是2016 ECCV上的pape...原创 2019-10-04 15:39:45 · 375 阅读 · 0 评论 -
Paper reading: MobileNet: Efficient Convolutional Neural Networks forMobile Vision Applications
首先,在目标检测中常说到两个名词,“backbone”,“head”?如果小伙伴已经在这个领域摸爬滚打一阵,估计说,这也要说嘛,但是每个人都是从不会到会的,也许一句话,就可以解决别人心中很久的疑惑,对吗?LZ在网上找了个解释,还算是讲的比较清楚的。在许多计算机视觉任务中,backbone是作为一个特征提取器进行使用的,也就是我们常见的在ImageNet,或者COCO等数据集上进行预训练好的...原创 2019-10-05 17:35:30 · 468 阅读 · 0 评论
分享