- 博客(66)
- 资源 (15)
- 收藏
- 关注
原创 30种经典GAN代码集锦及数据分享
一站式生成对抗网络研究与实践指南,该仓库因维护者时间限制已暂停更新,博主增加了数据试用后打包在百度云盘中,供分享。通过网盘分享的文件GAN.zip链接: https://pan.baidu.com/s/1vI8MdaQJMn-D4fn-crKALA?pwd=2rk7 提取码: 2rk7。
2025-04-02 17:41:05
252
1
原创 Semantic Flow for Fast and Accurate Scene Parsing可执行代码分享及语义流对齐思路介绍
论文《Semantic Flow for Fast and Accurate Scene Parsing》原理解析及可执行代码分享,用于滑坡检测示例。光流的理念来自于视频处理任务,在对齐两个相邻的视频帧特征时光流非常有效且灵活,这启发作者设计了一种基于流对齐模块(FAM),通过在网络内部预测流场来对齐两个相邻层次的特征图。作者将这种流场定义为语义流,它是在特征金字塔的不同层次之间生成的。
2025-04-02 14:40:38
889
原创 铁路语义分割数据下载RailSem19: A Dataset for Semantic Rail Scene Understanding
RailSem19 是一个为铁路、道路场景理解提供丰富语义信息的数据集。它包含了 8500 张 由铁路车辆(包括火车和有轨电车)以自视角拍摄的图像,这些图像展示了在铁路和道路交汇区域的各种场景,包括铁路道口、城市街道上行驶的电车等。
2025-04-01 14:43:38
322
原创 Access to XMLHttpRequest at ‘file:///F:*from origin ‘null‘ has been blocked by CORS policy解决方法
这个问题是由于浏览器的 **跨域资源共享(CORS)** 策略引起的。具体来说,浏览器禁止了从本地文件路径(`file://`)加载资源的请求,因为 CORS 策略只允许某些协议(如 `http`、`https` 等)进行跨域请求。
2025-03-21 15:10:57
789
原创 深度学习PyTorch之动态计算图可视化 - 使用 torchviz 生成计算图
在深度学习模型的开发过程中,理解和可视化模型的计算图对于调试、优化和教学都具有重要意义。PyTorch 采用的是动态图机制,这使得每次前向传播时计算图都被动态创建。而 `torchviz` 是一个非常有用的工具,它可以将这些动态图转化为可视化图形,帮助我们更直观地理解模型的计算过程。在本篇博客中,我们将重点介绍如何使用 `torchviz` 生成和保存 PyTorch 模型的计算图,并结合实际训练代码进行展示。
2025-03-21 10:12:10
1215
原创 graphviz.backend.ExecutableNotFound: failed to execute ‘dot‘, make sure the Graphviz executables are
如果直接pip install torchziv,会直接将graphviz,torchziv两个都安装好,但是这种方法无法将graphviz导入系统路径。下载zip,解压后复制到python路径下即可。
2025-03-20 17:40:07
130
原创 源自Deformable Convolutional Networks的一种可变形卷积实现解析
在深度学习中的计算机视觉任务中,卷积神经网络(CNN)是最常见且强大的模型之一。然而,传统的卷积操作在处理具有几何变换(如旋转、平移、缩放等)或变形的图像时,通常表现得不够灵活。为了解决这一问题,**可变形卷积(Deformable Convolution)**应运而生。本文将详细解析DeformConv2D 类,它是可变形卷积的一种实现,帮助我们更好地理解可变形卷积的工作原理。
2025-03-20 16:47:37
983
原创 Rethinking BiSeNet For Real-time Semantic Segmentation细节损失函数学习
本博客为文章“Rethinking BiSeNet For Real-time Semantic Segmentation”损失函数学习和使用。细节图像中,细节像素的数量远少于非细节像素,细节预测是一个类别不平衡问题。因为加权交叉熵总是导致粗糙的结果,文章采用二元交叉熵和Dice损失来联合优化细节学习。
2025-03-19 18:54:14
920
原创 PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers原理解析与代码分享
PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers论文作者建立卷积神经网络与PID控制器之间的联系,揭示了这种双分支网络可以等效于比例积分控制器,本质上也会遭受类似的超调问题。基于此,提出了一种基于PID控制器架构的三分支网络PIDNet,PIDNet在推理速度和准确度之间达到了最佳平衡,领先于所有现有模型(2023年)
2025-03-19 16:49:19
782
原创 深度学习PyTorch之数据加载DataLoader
数据加载是训练过程中的关键环节。高效的数据加载可以显著提升模型训练的效率和速度。在 PyTorch 中,DataLoader 是处理数据加载的核心工具,它提供了灵活的数据加载、批处理、数据增强等功能
2025-03-10 22:08:57
723
原创 ESPNetv2: A Light-weight, Power Efficient, and General Purpose Convolutional *原理解析与病虫害检测代码分享
ESPNetv2是ESPNet的优化,本博客解析其核心设计原理,揭示其如何通过深度可分离空洞卷积、分组逐点卷积和层次特征融合等技术突破传统网络的计算瓶颈。
2025-03-10 21:55:10
963
原创 深度学习训练中GPU内存管理
在深度学习模型训练中,主流 GPU 显存通常为 8GB~80GB,内存不足会导致训练中断或 Batch Size 受限,GPU 内存管理是优化性能和避免 OutOfMemoryError 的关键挑战。本博客简介 PyTorch 中 GPU 内存管理的核心函数、用法和实战技巧,帮助开发者高效利用显存资源。
2025-03-08 09:00:00
916
原创 Conda创建新环境等常用命令汇总
Conda 是一个流行的包管理器和环境管理工具,广泛应用于数据科学、机器学习等领域。它可以帮助我们管理 Python 包以及不同版本的环境,避免包冲突,提升项目的可复现性。以下是一些常用的 Conda 命令,涵盖环境创建、管理、包安装等常见操作。
2025-03-08 09:00:00
468
原创 Polarized Self-Attention: Towards High-quality Pixel-wise Regression曾经屠榜的PSA极化注意力模型原理解析与代码分享
语义分割希望在处理高分辨率的图片时,能够捕捉到图片中不同部分之间的远距离关系,但是又不能让计算过程变得太复杂或者太费时,因此,提出了针对高质量像素级回归任务的自注意力机制--极化自注意力(PSA)机制。
2025-03-07 16:57:58
549
原创 SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segment模型解析与代码分享
文章《SAM2-UNet: Segment Anything 2 Makes Strong Encoder for Natural and Medical Image Segmentation》提出了网络模型SAM2-UNet,在伪装物体检测、显著性检测、海洋动物分割、镜像检测、息肉分割应用,证明Segment Anything Model 2(SAM2)可以作为强大的编码器,用于通用图像分割。本博客对该模型进行解析。
2025-03-07 15:18:29
1321
原创 深度学习 PyTorch 中 18 种数据增强策略与实现
数据增强通过对训练数据进行多种变换,增加数据的多样性,它帮助我们提高模型的鲁棒性,并减少过拟合的风险。PyTorch 提供torchvision.transforms 模块丰富的数据增强操作,我们可以通过组合多种策略来实现复杂的增强效果。本文将介绍 18 种常用的图像数据增强策略,并展示如何使用 PyTorch 中的 torchvision.transforms 来实现这些策略。
2025-03-06 13:44:53
1171
原创 深度学习PyTorch之13种模型精度评估公式及调用方法
模型训练后需要评估模型性能,因此需要了解各种评估指标的具体用法和背后的数学原理,本博客以清晰的格式呈现**分类任务评估指标**的名称、调用示例、公式说明。
2025-03-06 13:14:26
1116
原创 CFPNet: Channel-wise Feature Pyramid for Real-Time Semantic Segmentation模型解析及代码实战分享
CFPNet(Channel-wise Feature Pyramid Network)是一种面向实时语义分割任务的高效网络结构,其**核心创新点在于提出了通道特征金字塔(CFP)模块**。该模块通过在通道维度上进行多尺度特征融合,显著提升了模型对多尺度目标的感知能力,同时保持了较低的计算复杂度。
2025-03-05 10:00:00
1250
原创 yolov12的cuda/cudnn/torch(torch-2.2.2+cu121-cp38-cp38-win_amd64.whl)/torchvision环境全安装包
最近yolov12已出,需要根据requirements.txt更新环境,此处通过百度云盘将对应文件存档。文件包括cuda_12.1.0_531.14_windows.exe、cudnn-windows-x86_64-8.9.7.29_cuda12-archive.zip、torch-2.2.2+cu121-cp38-cp38-win_amd64.whl和一个用于测试是否安装成功的py文件。
2025-03-05 09:52:53
463
原创 mmseg的decode_heads解析:理解语义分割解码器设计
在语义分割任务中,解码器(Decoder) 的设计直接影响模型对特征图的上采样能力和细节恢复效果。作为开源语义分割框架 mmsegmentation 的核心组件,decode_heads 提供了多种经典和前沿的解码器实现。本文将深入解析 mmseg 中常见的 decode_heads,包括其核心思想、结构设计、适用场景及代码实现,帮助读者全面掌握语义分割解码器的技术脉络。
2025-03-04 10:52:14
810
原创 DIY损失函数--以自适应边界损失为例
深度学习中常涉及需要自定义损失函数的情况,本博客先介绍一种融合Diceloss和边界损失的损失函数原理,该融合损失函数在计算Dice系数时考虑了边界区域的信息,通过对交集部分加权,并以自适应计算的 $\alpha$ 调整边界区域和整体区域之间的贡献,从而优化了边界区域的分割精度;再通过代码创建,最后训练调用,以使读者掌握随时新创损失函数能力。
2025-03-04 10:27:35
963
原创 FarSee-Net: Real-Time Semantic Segmentation模型解析及代码分享滑坡检测实战
论文《FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale Context Aggregation and Feature Space Super-resolution》原理解析及代码复现。
2025-03-03 13:11:44
1097
原创 深度学习pytorch之简单方法自定义9类卷积即插即用
本文详细解析了 PyTorch 中 torch.nn.Conv2d 的核心参数,通过代码示例演示了如何利用这一基础函数实现多种卷积操作。涵盖的卷积类型包括:标准卷积、逐点卷积(1x1 卷积)、非对称卷积(长宽不等的卷积核)、空洞卷积(扩大感受野)、深度卷积(逐通道滤波)、组卷积(分组独立处理)、深度可分离卷积(深度+逐点组合)、转置卷积(上采样)和动态卷积(动态生成卷积核),帮助读者理解如何通过调整参数灵活构建卷积层,适应不同任务需求。
2025-03-03 12:20:03
999
原创 深度学习pytorch之4种归一化方法(Normalization)原理公式解析和参数使用
**归一化**(Normalization)是提升模型性能、加速训练的重要技巧。归一化方法可以帮助减少梯度消失或爆炸的问题,提升模型的收敛速度,且对最终模型的性能有显著影响。本文将以 PyTorch 为例,介绍4种常见的归一化方法:BatchNorm、Layer Norm、Instance Norm、Group Norm,并详细讲解它们的原理和公式。
2025-03-02 19:35:32
1484
原创 SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformer *模型解析及滑坡语义分割实战
SegFormer 是一种基于 Transformer 的语义分割模型,通过结合 多尺度特征融合 和 轻量级解码器,在保持高效性的同时实现了高精度分割。其核心思想是利用 Transformer 提取全局上下文信息,并通过多级特征融合提升细节恢复能力。
2025-03-02 18:45:00
955
原创 Lite-HRNet: A Lightweight High-Resolution Network原理解析及代码分享
论文《Lite-HRNet: A Lightweight High-Resolution Network》原理解析及代码复现。Lite-HRNet是针对实时语义分割任务优化的轻量级网络,其核心思想是在高分辨率特征保持与计算效率之间取得平衡。相比原版HRNet,通过引入多分辨率特征交互机制与通道重参数化技术。论文提出者用于人体姿态估计,本文将其用于语义分割训练,损失无法下降,基本全无法提取,本文仅作为结构学习记录
2025-03-01 17:35:27
961
原创 基于PyQt5的简易薪酬管理系统纯代码开发解析
本文详细解析了如何使用PyQt5和SQLite开发一个轻量级薪酬管理系统。通过分步拆解核心代码,从界面布局、数据库连接到增删改查功能的实现,完整呈现桌面端数据库应用的开发流程。文章不仅提供基础功能实现,还包含数据验证、导出扩展等进阶技巧,并附有清晰的代码解释和运行流程图,帮助读者快速掌握PyQt5与SQLite的整合方法,为开发小型企业管理系统提供实践参考。
2025-03-01 17:32:24
451
原创 纯代码实战--用Deepseek+SQLite+Ollama搭建数据库助手
本博客手把手教学通过Python调用Deepseek大模型快速搭建智能薪酬问答系统,实现“说人话查数据”。通过整合Ollama大模型与SQLite数据库,开发了一个能理解自然语言、自动生成SQL、安全执行查询并给出人性化解读的AI助手。 文章详解三大核心模块——智能SQL生成器、安全查询引擎、结果解释器,讲解数据流转逻辑,给出大模型连接结构化数据的全链路开发示例。
2025-02-28 14:18:46
1663
原创 BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation原理解析及代码复现
BiSeNetv2是面向实时语义分割任务的高效网络架构,其核心设计理念是通过双分支结构实现细节特征与语义特征的协同优化。本博客是对论文《 BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation 》原理解析及代码复现。
2025-02-28 10:29:27
789
原创 Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation (DDRNet2021)原理解析及代码实践
DDRNet(Deep Dual-Resolution Network)是一种实时语义分割网络架构,通过双重分辨率路径进行特征提取,一条路径专注于细节信息的捕获,另一条路径则处理全局信息,最终通过融合这两条路径的信息来优化网络的表现。本博客对论文《Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes》进行原理解析及代码复现。
2025-02-27 21:42:38
1191
原创 双目摄像头物体测距定位基础原理
双目摄像头测距原理概要:本文介绍了基于双目视觉系统的三维坐标解算与深度测量原理。通过左、右相机的内外参矩阵以及图像中视差信息,理解从二维图像如何实现三维重建与测距。
2025-02-26 16:03:58
1048
原创 图像匹配:基于SIFT和FLANN的双视图匹配及极线绘制代码
本博客通过一个简单的示例,展示如何使用OpenCV的SIFT(尺度不变特征变换)算法和FLANN(快速近似最近邻)匹配器进行图像匹配,并绘制极线(epipolar lines)。代码实现了以下功能:1. 使用SIFT算法检测关键点并计算描述符;2. 使用FLANN匹配器进行特征点匹配;3. 根据Lowe的比率测试筛选出优质匹配;4. 使用RANSAC算法从匹配点中估计基础矩阵(Fundamental Matrix),并过滤掉外点;5. 计算并绘制两张图像的极线(Epiline),用于可视化几何关系
2025-02-26 15:57:54
623
原创 从图片生成3维场景--NERF原理解析及加速版HashNeRF-pytorch代码分享
NeRF(Neural Radiance Fields)是一种基于神经网络的三维图像生成技术,通过一组从不同角度拍摄的2D图片,生成一个3D场景,并且能够渲染出该场景在任意视角下的图像。这项技术的核心思想是利用神经网络的强大建模能力来预测三维空间中每一点的光照和颜色。
2025-02-24 22:43:12
925
原创 单目摄像头物体深度计算基础原理
本博客描述了如何将物体的世界坐标投影到相机图像平面。在这个公式中,物体的深度 $Z$由物体在图像平面中的位置(像素坐标$u, v$)以及相机的参数(焦距、内外参数矩阵)决定。通过将物体的图像坐标与相机的内外参数矩阵结合,我们可以推算出物体的实际距离。
2025-02-24 15:50:27
1203
原创 使用 Python 和 OpenCV 从一组图片合成 MP4 格式的视频
在创建动画、制作幻灯片,从生成的图像数据中导出动态视频时,我们需要将一系列静态图片合成一个视频。本博客使用 Python 和 OpenCV 从一组图片生成 MP4 格式的视频
2025-02-20 22:39:47
555
原创 深度学习pytorch之22种损失函数数学公式和代码定义
本篇博客探讨了PyTorch中的 22 种常用损失函数,涵盖了从传统的回归问题到复杂的分类任务等多种应用场景。每个损失函数都附带了详细的数学公式和代码实现,帮助读者更好地理解损失函数的工作原理。
2025-02-20 11:01:44
743
原创 ModuleNotFoundError: No module named ‘timm.optim.novogr两种解决方法
from timm.optim.novograd import NovoGrad,解决bug :ModuleNotFoundError: No module named 'timm.optim.novograd'
2025-02-19 21:11:40
270
原创 深度学习pytorch之19种优化算法(optimizer)解析
本博客详细介绍了多种常见的深度学习优化算法,包括经典的LBFGS 、Rprop 、Adagrad、RMSprop 、Adadelta 、ASGD 、Adamax、Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析,博客旨在为机器学习工程师和研究人员提供清晰的理论指导,帮助读者选择合适的优化算法提升模型训练效率。
2025-02-19 20:57:31
1712
原创 实时图像超分辨率:高效子像素卷积网络(ESPCN)解析与代码分享
这篇博客介绍了基于ESPCN(Efficient Sub-Pixel Convolutional Neural Network)超分辨率技术,通过使用高效的子像素卷积神经网络实现实时的单幅图像和视频超分辨率重建,博客中提供了完整的代码实现、预训练模型,支持用户通过简单的命令进行训练和测试。
2025-02-18 20:35:49
335
基于pytorch实现的ICCV2019HarDNet: A Low Memory Traffic Network算法
2022-03-03
基于pytorch实现的BiSeNet V2: Bilateral Network with Guided 可直接执行算法
2022-03-03
基于pytorch的Semantic Flow for Fast and Accurate Scene Parsing算法
2022-03-03
Python端QTdevelop影像查看小程序.zip
2021-07-21
影像风格迁移.zip
2020-05-18
34findstartandend.py
2019-12-17
支持中文路径和中文属性的编译好的gdal库
2019-04-24
tushare股票前复权数据获取及实现均线、kdj、macd等计算
2019-02-25
AI算法工程师手册
2018-12-06
places205CNN_deploy30万次预训练模型caffemodel
2018-11-28
机器学习判断是猫还是狗
2018-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人