
个人学习笔记
文章平均质量分 82
该学习笔记为本人研究的一些相关技术所做的分享,希望对大家有帮助,欢迎点赞关注!
IRevers
爱科研,爱生活,爱分享。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【多任务YOLO】A-YOLOM
本文提出了一种轻量级实时多任务模型A-YOLOM,用于自动驾驶中的目标检测、可驾驶区域分割和车道线分割。该模型采用统一的分割结构和自适应拼接模块,通过可学习参数优化特征融合,简化了分割头设计并使用相同的损失函数处理所有分割任务。在BDD100k数据集上,A-YOLOM实现了81.1%的mAP50(检测)、91.0%的mIoU(可驾驶区域)和28.8%的IoU(车道线)。实验表明,该模型在真实场景中的表现优于对比方法,展现出良好的泛化能力和部署潜力。原创 2025-07-22 22:35:30 · 609 阅读 · 0 评论 -
【自动驾驶】经典LSS算法解析——深度估计
LSS(Lift, Splat, Shoot)是一种将多相机图像转换为BEV(鸟瞰图)特征的3D感知方法。其核心流程分为三步:首先通过深度估计将2D图像升维为3D视锥点云(Lift);然后将点云特征投影到BEV空间并聚合(Splat);最后在BEV特征上进行路径规划等任务(Shoot)。该方法采用EfficientNet提取图像特征,利用相机内外参将特征投影到200×200的BEV网格(50m×50m范围),通过深度概率分布实现精准特征转换。LSS支持多相机融合,适用于自动驾驶中的语义分割和轨迹预测任务。原创 2025-07-09 20:16:54 · 915 阅读 · 0 评论 -
【模型微调】 5%>100%:BreakingPerformance Shackles of Full Fine-Tuning on Visual Recognition Tasks
作者提出了Multi-cognitive Visual Adapter (Mona) 调优,这是一种新颖的基于适配器的调优方法。原创 2025-06-03 22:35:37 · 606 阅读 · 0 评论 -
MMDetection3D最全源码安装教程
MMDetection3D安装教程原创 2025-05-25 21:48:03 · 1235 阅读 · 0 评论 -
【CVPR2025】Transformers without Normalization
本研究表明,没有归一化的transformer(transformer)可以通过一种简单的技术实现相同或更好的性能。作者引入 动态双曲正切(Dynamic Tanh,DyT) ,一个逐元素操作 $DyT(x) = tanh(\alpha x)$,作 为transformer中归一化层的直接替代。 DyT的灵感来自于观察到 transform(transformer)中的层归一化通常生成类似tanh的 S 形输入输出映射。原创 2025-03-16 19:02:18 · 1330 阅读 · 0 评论 -
【问题解决】libcudart.so.11.0: cannot open shared object file: No such file or directory
【问题解决】libcudart.so.11.0: cannot open shared object file: No such file or directory原创 2025-03-03 22:37:06 · 2779 阅读 · 0 评论 -
YOLOv12最全使用教程【含ONNX模型推理】
YOLOv12在所有流行的实时目标检测器中,在准确性方面超越了它们,并且速度具有竞争力。例如,YOLOv12-N在T4 GPU上实现了40.6%的mAP,推理延迟为1.64毫秒,相比先进的YOLOv10-N/YOLOv11-N,在相当的速度下,**mAP提高了2.1%/1.2%**。这种优势也扩展到了其他模型规模。YOLOv12还超过了那些改进DETR的端到端实时检测器,如RT-DETR/RT-DETRv2:YOLOv12-S在运行速度比RT-DETR-R18/RT-DETRv2-R18快42%的情况下,仅原创 2025-02-22 20:29:28 · 3265 阅读 · 0 评论 -
Deepseek本地部署最全教程
最近,Deepseek在互联网掀起一阵浪潮,原因在于其用较低的成本训练出一个能和openai的chatgpt4媲美的大模型deepseek。原创 2025-02-09 09:21:43 · 523 阅读 · 0 评论 -
【Pytorch和Keras】使用transformer库进行图像分类
现在大多数的模型都会上传到huggface平台进行统一的管理,transformer库能关联到huggface中对应的模型,并且提供简洁的transformer模型调用,这大大提高了开发人员的开发效率。本博客主要利用transformer库实现一个简单的模型微调,以进行图像分类的任务。原创 2025-02-01 18:09:34 · 1777 阅读 · 0 评论 -
【CAN】asc报文格式文件合并(python版)
本博客主要介绍了如何用python根据时间对asc格式报文文件进行合并,方便进行后期的数据读取和整合。原创 2024-12-14 13:12:59 · 1742 阅读 · 0 评论 -
使用Python和Pybind11调用C++程序(CMake编译)
pybind11 是一个轻量级的头文件库,用于在 Python 和 C++ 之间互相暴露类型,主要用于为现有的 C++ 代码创建 Python 绑定。原创 2024-11-26 23:05:15 · 1593 阅读 · 0 评论 -
2024强化学习的结构化剪枝模型RL-Pruner原理及实践
2024强化学习的结构化剪枝原理及实践原创 2024-11-16 21:02:17 · 2253 阅读 · 0 评论 -
结合文本的视觉目标定位:DQ-DETR: Dual Query Detection Transformer for Phrase Extraction and Grounding
结合文本的视觉目标定位:DQ-DETR: Dual Query Detection Transformer for Phrase Extraction and Grounding原创 2024-10-31 23:55:27 · 1095 阅读 · 0 评论 -
CLIP零样本识别-CIFAR10/100
利用CLIP的API来识别验证CLIP在CIFAR10/100的零样本识别效果。原创 2024-09-22 23:41:39 · 842 阅读 · 0 评论 -
【CNN轻量化】RepViT: Revisiting Mobile CNN From ViT Perspective
探究了许多轻量级ViTs和轻量级CNNs之间的结构联系。文中从ViT的视角重新审视轻量级CNNs的高效设计,并强调它们在移动设备上的前景。具体而言,通过整合轻量级ViTs的高效架构设计,逐步增强了标准轻量级CNN,最终形成了一系列全新的纯轻量级CNNs,即RepViT。大量实验证明,RepViT优于现有的轻量级ViTs,并在各种视觉任务中表现出有利的延迟。值得注意的是,在ImageNet上,**RepViT在iPhone 12上以1.0毫秒的延迟实现了超过80%的top-1准确率**,这是轻量级模型首次实现原创 2024-03-19 00:13:58 · 6208 阅读 · 0 评论 -
【目标检测】TinyDet: Accurate Small Object Detection in Lightweight Generic Detectors
小目标检测新方法TinyDet原创 2023-12-18 23:31:58 · 1796 阅读 · 0 评论 -
【CNN轻量化】ParameterNet: Parameters Are All You Need 参数就是你所需要的
本文旨在增加大规模视觉预训练模型中的参数数量,同时最大限度地减少FLOPs的增加。利用动态卷积额外的参数引入网络中,而仅仅带来了FLOPs的轻微增加。ParameterNet方法使得低FLOPs网络能够充分利用大规模视觉预训练。原创 2024-03-20 22:07:06 · 3163 阅读 · 0 评论 -
Vision Mamba 双向状态空间模型下的高效视觉表示学习
Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model 双向状态空间模型下的高效视觉表示学习原创 2024-03-30 21:01:11 · 9741 阅读 · 0 评论 -
【ViT系列】更加符合视觉感知 TransNeXt: Robust Foveal Visual Perception for Vision Transformers
TransNeXt提出了一种基于仿生中央视觉设计的Token Mixer,即聚合注意力,以及一种带有门控通道注意力的通道混合器,即卷积GLU。将它们结合起来提出了一种强大且高度稳健的视觉模型TransNeXt,该模型在分类、检测和分割等各种视觉任务中实现了最先进的性能。TransNeXt在多尺度推断中的出色表现突显了其在解决深度退化问题方面相对于大内核策略的优势。原创 2024-03-23 22:56:22 · 3477 阅读 · 0 评论 -
【超分轻量化】Fully 1 × 1 Convolutional Network for Lightweight Image Super-Resolution (SCNet)
文中提出了一种简单而有效的**全$1 \times 1$卷积网络**,名为**Shift-Conv-based Network(SCNet)**。通过结合一个**无参数**的空间位移操作,使全$1 \times 1$卷积网络具备了强大的表示能力。原创 2024-03-27 23:21:02 · 1796 阅读 · 0 评论 -
【Python报错】urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify
【Python报错】urllib.error.URLError:原创 2023-12-30 16:10:18 · 4754 阅读 · 0 评论 -
Pytorch实现Warm_up学习率调整
Warm up是在ResNet上提出的一种调整学习率的方法,文中认为学习率在初始的时候不应该过大,应该渐进式地增加到初始学习率,这样有利于模型的训练和泛化能力的提升。原创 2023-12-05 22:59:50 · 1288 阅读 · 0 评论 -
YOLOv9最全使用教程与部署
yolov9使用指南原创 2024-02-25 00:17:13 · 12026 阅读 · 21 评论 -
[Pytorch教程]之将经过transforms的张量还原为图像
在实验过程中,需要将经过变换后的图像还原回实际的RGB图进行可视化。原创 2023-07-28 09:29:13 · 1167 阅读 · 3 评论 -
【保姆级教程】SShfs+Winfsp文件挂载和传输工具使用
SShfs是一款将局域网电脑中的文件挂载到本地磁盘某一位置的软件,支持输出传输,性能稳定,可靠。原创 2023-06-26 10:52:09 · 5762 阅读 · 1 评论 -
思维导图之AI最全学习路线
思维导图之AI最全学习路线转载知乎链接: https://zhuanlan.zhihu.com/p/64052743.结合推文,将各个分支结合起来,构建一个全面的知识网络,供初入AI领域的程序员参考#接下来就直接上传图思维导图未来计划上传MindMaster版带网页链接的思维导图,尽情期待!!!!引用链接: https://zhuanlan.zhihu.com/p/6405274...转载 2019-11-22 17:20:40 · 1338 阅读 · 0 评论 -
全局平均池化(Global average pooling, GAP)
全局平均池化(Global average pooling, GAP)原创 2023-03-01 09:55:50 · 3058 阅读 · 0 评论 -
YOLOv5 实践之PCB缺陷检测
YOLO模型思想简述:YOLO (You Only Look Once) 是属于目标检测中的“one-stage”方法。原创 2022-11-14 15:22:49 · 2221 阅读 · 4 评论 -
PyTorch 加载预训练权重
PyTorch 加载预训练权重原创 2022-10-08 16:19:57 · 6582 阅读 · 0 评论 -
Python指定使用gpu
单/多卡GPU使用设置原创 2022-08-05 09:48:17 · 15048 阅读 · 0 评论 -
MATLAB初始化数据方法汇总
1. randi():产生均匀分布的伪随机数(整数)Examples:% 产生满足1-10之间均匀分布的3*5随机矩阵a1 = randi(10, 3, 5);% 产生满足-5-5之间均匀分布的2*10随机矩阵a1 = randi([-5, 5], 2, 10);2. rand():产生均匀分布的伪随机数Examples:% 产生满足[0, 1]均匀分布的4*5随机矩阵a2 = rand(4, 5);% 产生满足[a, b]均匀分布的2*5随机矩阵(常用)a2 = a+(b-a)原创 2021-07-13 18:43:45 · 4457 阅读 · 0 评论