自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 【MLP多层感知机】

MLP(多层感知机,Multilayer Perceptron)是一种前馈人工神经网络(Feedforward Artificial Neural Network),是深度学习中的基础模型之一,主要用于分类和回归任务。

2025-03-22 19:11:54 247

原创 【DETR】训练自己的数据集以及YOLO数据集格式(txt)转化成COCO格式(json)

DETR(Detection with TRansformers)是基于transformer的端对端目标检测,无NMS后处理步骤,无anchor。

2025-03-22 19:08:07 1042

原创 【产品经理的三大文档】

这三类文档有时候会结合实际情况进行调整,比如在互联网公司,MRD 和 BRD 可能会合并成一份商业需求文档,而 PRD 则会细化到不同模块。但无论如何,它们的核心作用都是帮助团队高效协作、确保产品落地。

2025-03-16 22:26:37 768

原创 【Kaggle Tutorial的使用】

什么是Kaggle?Kaggle允许你在线编写和执行Python代码无需配置免费使用GPU(每周30小时)轻松共享更强的GPU资源上传数据集,举办竞赛…

2025-03-13 20:21:30 525

原创 【Colab Tutorial的使用】

什么是Colab 或者 Colaboratory?Colaboratory 是一个 Google 研究项目,旨在帮助传播机器学习培训和研究成果。它是一个 Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行。Colaboratory 笔记本存储在 Google 云端硬盘中,并且可以共享,就如同您使用 Google 文档或表格一样。Colaboratory 可免费使用。

2025-03-13 15:09:23 1207

原创 【机器学习的主要类型】

通过 试错(Trial & Error) 进行学习,智能体(Agent)与环境交互,并基于奖励或惩罚调整策略,以实现目标最大化。降维(Dimensionality Reduction):用 PCA(主成分分析)减少数据维度,提高计算效率。分类(Classification):识别邮件是否为垃圾邮件(Spam/Not Spam)。训练数据有 输入(特征) 和 正确的输出(标签),模型通过学习映射关系来进行预测。奖励(Reward):智能体的反馈信号,鼓励好的行为。回归(Regression):预测房价。

2025-03-11 11:49:17 407

原创 【Mamba和Transformer的关系】

Mamba 和 Transformer 都是深度学习模型架构,用于处理序列数据(如自然语言、时间序列等),但它们的核心机制和计算方式有所不同。KV 缓存(Key-Value Cache):为了优化推理时的计算量,Transformer 会缓存已计算的 key 和 value,但仍然受到存储和计算限制。计算复杂度 O(N²):注意力机制的计算量随着序列长度 N 的增加呈二次增长,因此在处理超长序列时成本高昂。Mamba 不是 Transformer 的直接替代,而是对长序列任务的一种更高效的架构选择。

2025-02-21 19:34:13 434

原创 DeepSeek最新论文精读:【Native Sparse Attention 一种硬件对齐且可训练的稀疏注意力机制】

我们提出NSA(原生可训练稀疏注意力,Natively trainable Sparse Attention),该机制结合了算法创新与硬件对齐优化,实现了高效的长上下文建模。NSA 采用 **动态分层稀疏策略,结合粗粒度的 token 压缩和细粒度的 token 选择,在保持全局上下文感知的同时确保局部精确性。

2025-02-21 19:30:50 973

原创 李宏毅机器学习笔记:【6.Optimization、Adaptive Learning Rate】

critical point不一定是你在训练一个network时候遇到的最大的障碍。

2025-02-15 19:58:48 1338

原创 李宏毅机器学习笔记:【5.Batch和Momentum的训练技巧】

每次训练一个batch计算一次Loss所有的Batch看过一遍叫做一个epoch。

2025-02-14 11:54:03 846

原创 【科研人必备:全面查找文献,查作者研究的所有文献】

如何快速查全、查准文献

2025-02-12 11:47:51 232

原创 数据增强方法:【Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation】

在本研究中,我们系统地研究了实例分割中的 Copy-Paste 数据增强,其中我们随机将物体粘贴到图像上。先前关于 Copy-Paste 的研究依赖于对周围视觉上下文的建模来粘贴物体。然而,我们发现简单的随机粘贴物体机制已经足够有效,并且在强基线上可以提供显著提升。此外,我们表明 Copy-Paste 可以与利用伪标签(如自训练)额外数据的半监督方法结合使用,从而进一步提升性能。

2025-02-12 11:47:05 1188

原创 【iSAID:用于航空影像实例分割的大规模数据集】

我们的大规模、高密度标注的航空影像实例分割数据集(iSAID)包含 655,451 个目标实例,涵盖 15 个类别,分布在 2,806 张高分辨率图像中。

2025-02-11 21:39:44 1350

原创 【煤矿井下数据集】

本文开发了一个地下长壁采矿工作面的图像数据集(DsLMF+),该数据集包含138004张图像,标注了6类目标,分别是矿工、液压支架护板、大块煤、拖缆、矿工行为以及矿用安全帽。所有数据集标签均以YOLO格式和COCO格式公开提供。

2025-02-11 14:45:59 1452 1

原创 精度论文:【Focaler-IoU: More Focused Intersection over Union Loss】

现有研究通过利用边界框之间的几何关系来提升回归性能,但忽略了困难样本与易样本分布对边界框回归的影响。在本文中,我们分析了困难样本与易样本分布对回归结果的影响,并提出了Focaler-IoU,该方法通过聚焦不同的回归样本,能够在不同的检测任务中提高检测器的性能。

2025-01-16 21:37:40 1173

原创 精度论文:【Coordinate Attention for Efficient Mobile Network Design】

我们提出了一种新颖且高效的注意力机制,通过将位置信息嵌入通道注意力,使移动网络能够关注更大的区域,同时避免显著增加计算开销。

2025-01-08 22:30:48 1228

原创 【通俗理解RNN】

首先要了解一下最基本的单层网络,它的结构如下图所示:输入是x,经过变换Wx+b和激活函数f,得到输出y。在实际应用中,我们还会遇到很多序列形的数据:而其中,就不太好用原始的神经网络处理了。为了建模序列问题,RNN引入了隐状态h(hidden state)的概念,隐状态h可以对序列形的数据提取特征,接着再转换为输出。先从h1​的计算开始看:图示中记号的含义是:a)圆圈或方块表示的是向量。b)一个箭头就表示对该向量做一次变换。如上图中h0​和x1​。

2024-12-07 18:17:20 1071 2

原创 Lightweight Object Detection: A Study Based on YOLOv7 Integrated with ShuffleNetv2 and ViT

随着计算机视觉领域的快速发展,目标检测已经成为多个应用领域的关键组成部分,涉及安全监控、自动驾驶和智能医疗等领域。尽管传统的目标检测方法在计算复杂度和实时性方面存在不足,但基于深度学习的算法在准确性和实时性能方面取得了显著突破。在这些算法中,YOLO(You Only Look Once)[1, 3, 4, 6, 8, 10, 12]已成为经典的实时目标检测算法,成功地在计算速度和检测精度之间达到了平衡。然而,移动设备通常面临计算能力、内存容量和能耗的限制,这使得深度学习模型的部署变得复杂。

2024-11-29 22:19:12 741

原创 精读论文:【Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising】

这篇论文提出了一种新的混合卷积和注意力网络(HCANet),用于高光谱图像(HSI)去噪。HCANet结合了卷积神经网络(CNNs)和Transformer的优势,以同时增强全局和局部特征的建模。为了捕获长距离依赖性和邻域光谱相关性,作者设计了一个卷积和注意力融合模块(CAFM)。此外,为了改善多尺度信息聚合,作者设计了一个多尺度前馈网络(MSFN),通过提取不同尺度的特征来增强去噪性能。

2024-11-25 20:56:43 2659 1

原创 【高光谱图像解释】

高光谱图像(Hyperspectral Image, HSI) 是一种包含丰富光谱信息的图像类型,能够记录每个像素在多个连续光谱波段上的反射或辐射强度。与普通彩色图像(如RGB图像)只包含红、绿、蓝三个波段的光谱信息不同,高光谱图像的光谱分辨率更高,可以涵盖数百甚至上千个窄波段。这使得高光谱图像能够捕获物质的细微光谱特征,实现传统成像无法达到的精细分析。

2024-11-25 17:14:07 1908

原创 YOLO-FaceV2: A Scale and Occlusion Aware Face Detector

我们设计了一个称为RFE的感受野增强模块 来增强小人脸的感受野,并使用NWD Loss来弥补loU对小物体位置偏差的敏感性。针对人脸遮挡问题我们提出了一种称为SEAM的注意力模块,并引入了排斥损失(Repulsion Loss) 来解决它。此外我们使用 滑动权重函数(Slide) 来解决简单样本和困难样本之间的不平衡问题,并利用有效感受野的信息来设计锚框。

2024-11-23 18:02:04 1536 1

原创 SAM:Segment Anything

我们推出了“分割万物”(Segment Anything,简称SA)项目:这是一个全新的图像分割任务、模型及数据集。我们利用高效的模型构建了一个数据收集循环,从而创建了迄今为止(遥遥领先)规模最大的分割数据集,该数据集包含1100万张获得授权且尊重隐私的图像,这些图像上共有超过10亿个分割掩码。该模型经过专门设计和训练,具备可提示性,因此能够实现零样本迁移,适应新的图像分布和任务。我们在众多任务上评估了该模型的能力,发现其零样本表现十分出色——通常能与先前的全监督结果相媲美,甚至更胜一筹。

2024-10-24 22:32:53 979

原创 【SAM+YOLOv8实现图像批量分割提取分割掩码】

本文主要根据xml标签信息作为提示,将目标检测框框选的内容进行实例分割,提取分割掩码。

2024-10-24 22:23:07 1978 1

原创 GroupMamba: Parameter-Efficient and Accurate Group Visual State Space Model

在语言和视觉理解领域,出现了各种上下文建模方法。这些方法包括卷积、注意力机制,以及最近的状态空间模型。具有多头自注意力机制的Transformer一直是语言模型(如GPT-3)和视觉模型(如Vision Transformers)的核心。然而,由于注意力机制的计算复杂度是二次方的,特别是在处理较长序列时,这导致了计算复杂度的挑战,进而催生了像S4这样的状态空间模型的出现。

2024-09-20 22:12:08 1116

原创 LSM-YOLO: A Compact and Effective ROI Detector for Medical Detection

提出了一种名为轻量级旁路匹配Lightweight Shunt Matching-YOLO(LSM-YOLO)的新型模型,该模型包含轻量级自适应提取(LAE)和多路径旁路特征匹配(MSFM)。 首先,通过使用LAE 来精细化特征提取,模型可以从多尺度特征图中获得更多的上下文信息和高分辨率细节 ,从而在减少噪声影响的同时提取医学图像中ROI的详细特征 。其次,MSFM 被用来进一步细化高级语义特征和低级视觉特征的融合,使得ROI特征与邻近特征之间的融合更好,从而提高检测率,以更好地辅助诊断.

2024-09-20 16:38:49 1597 1

原创 压缩图片大小脚本

【代码】压缩图片大小脚本。

2024-09-16 22:42:07 215

原创 【Window11 不同cuda版本切换】

总结来说,手动切换 CUDA 版本的核心是更新系统环境变量。但是,有时候你基于当前的cuda版本建立了一个虚拟环境,这个时候在虚拟环境里面切换cuda,虚拟环境里面的cuda 没有变,是因为你的虚拟环境中已经安装了一些依赖于该 CUDA 版本的库,虚拟环境本身并不会“锁定” CUDA 版本,而是这些库通常会与特定版本的 CUDA 绑定在一起。所以在虚拟环境中,CUDA 版本一旦安装好后,通常不能直接在同一个虚拟环境中切换到不同的版本。因为 CUDA 的库和驱动与硬件以及软件的兼容性密切相关.。

2024-09-16 22:07:46 1203

原创 Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation

受以处理长序列和全局上下文信息并增强计算效率为特点的Mamba架构(作为状态空间模型SSM)的启发,我们提出了Mamba-UNet,这是一种将医学图像分割中的U-Net与Mamba能力相结合的新型架构。

2024-09-07 15:40:46 2887 4

原创 Vision GNN: An Image is Worth Graph of Nodes

网络架构在基于深度学习的计算机视觉系统中起着关键作用。广泛使用的卷积神经网络(CNN)和Transformer将图像视为网格或序列结构,但这在捕捉不规则和复杂对象时并不灵活。为了解决这一问题,本文提出了一种将图像表示为图结构的方法,并引入了一种新的视觉图神经网络(Vision GNN,简称ViG)架构,用于在视觉任务中提取图级特征。

2024-09-02 21:46:11 1552

原创 YOLOv8中Bottleneck模块详解

Bottleneck 模块在YOLOv8中的作用是进行特征提取和增强,是网络中的核心构建模块之一。它的主要功能是通过卷积操作来处理输入特征图,并在适当情况下应用残差连接,使得信息能够有效地通过网络层进行传播

2024-09-01 11:40:00 4086

原创 YOLOv8中的C2f模块代码详解

在YOLOv8网络结构中,C2f模块(CSP Bottleneck with 2 Convolutions)是一个关键组件,用于实现跨阶段部分聚合

2024-09-01 00:33:43 12669 6

原创 U-Mamba: Enhancing Long-range Dependency for Biomedical Image Segmentation

这篇论文介绍了一种名为U-Mamba的新型网络架构,旨在提高生物医学图像分割任务中的长距离依赖建模能力。U-Mamba结合了卷积神经网络(CNNs)的局部特征提取能力和状态空间序列模型(SSMs)处理长序列数据的优势。

2024-08-26 17:13:58 1193

原创 CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anacond

Conda默认使用的是官方镜像源,但由于网络原因,可能会导致无法连接或连接速度较慢。这时可以尝试更换成其他镜像源,例如清华大学镜像源。

2024-06-19 13:19:48 459

原创 【深度学习环境搭建】python+anaconda+cuda+pytorch

深度学习环境搭建python+anaconda+cuda+pytorch

2024-06-19 12:56:44 1441

原创 替换VOC数据格式xml文件里的标签信息

【代码】替换VOC数据格式xml文件里的标签信息。

2024-04-28 22:02:12 137

原创 leetcode题目:旋转数组 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。

【代码】leetcode题目:旋转数组 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。

2024-04-26 12:23:21 286 1

原创 Python直接调用内置排序函数写法(sort, sorted,argsort)

argsort 是用在 numpy 数据类型中的排序方法( numpy 里也有一个 sort 方法)sort, sorted 是用在 list 数据类型中的排序方法。

2024-04-25 17:08:42 138 1

原创 解决labelimg点击框选图片就闪退报错:TypeError: arguments did not match any overloaded call: d type ‘float‘

*解决方法一:**修改代码,找到报错文件所在行,修改其为int类型。解决方法二:pyhton版本过高了,修改python版本,将版本降低为3.9。以上两种方法都可成功解决!

2023-12-12 15:44:05 2169 3

原创 IDEA连接数据库报错:[08001] CLIENT_PLUGIN_AUTH is required com.mysql.cj.exceptions.UnableToConnectException:

解决idea连接MySQL报错问题

2023-11-17 20:02:09 3130

原创 考研数据结构名词解释

数据结构名词解释

2022-11-30 21:26:24 2249

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除