自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

向上生长的程序媛的博客

90后程序媛，主要研究方向为：遥感卫星图像地物要素智能识别、遥感影像变化检测、工业场景目标检测和语义分割、实例分割等。

原创【检索定位】系列第二弹：Game4Loc解析，含论文和代码下载链接

【摘要】厦门大学团队在AAAI2025提出基于游戏仿真的无人机地理定位新方法。针对现有数据集小规模、单一场景及完美匹配假设的局限，作者构建了GTA-UAV数据集，通过游戏引擎生成3万+张多高度(80-650m)、多姿态的无人机图像，并创新性定义部分匹配机制（正样本IOU>0.39，半正样本IOU∈[0.14,0.39]）。提出加权对比学习框架Weighted-InfoNCE，利用IOU动态调整损失权重，将检索精度R@1提升20.08%，定位误差降低234米。实验表明该方法在真实场景UAV-VisLoc

2025-11-18 11:47:26 809

原创【geopandas】计算矢量iou

本文介绍使用Python的geopandas库计算两个矢量文件要素交并比(IoU)的方法。主要步骤包括：1)加载矢量文件；2)遍历要素判断相交情况；3)计算IoU值并根据不同条件分类统计。代码实现了对完全不相交、单要素相交(阈值0.7)和多要素相交(阈值0.5)等情况的分类计数，最后输出各类统计结果。使用前需确保安装geopandas库(pip install geopandas)且文件坐标系一致。文末附完整代码和程序员节祝福。

2025-10-24 20:16:58 358

原创 [YOLOv8] 用YOLOv8实现指针式圆形仪表智能读数(四)

本文详细介绍了如何将YOLO格式分割结果（TXT文件）转换为三值输入图（0,1,2）的方法。通过Python代码实现转换过程：1）解析YOLO格式标注文件；2）使用不同颜色标识不同类别；3）生成三值灰度图并保存。代码支持批量处理，用户只需替换输入输出路径即可运行。文中还提供了数据说明和可视化效果示意图，帮助理解转换过程。该转换是将分割预测结果转化为后续处理所需格式的关键步骤。

2025-10-22 11:17:20 353 1

原创【工业场景】用YOLOv8实现行人识别

本文基于YOLOv8模型实现行人检测任务，使用包含78,298张图片的数据集（训练集77,706张，验证集8,592张）。详细介绍了数据准备、模型配置（YOLOv8m）、训练过程（300 epochs）及推理实现，最终达到80%以上的检测精度（AP50）。文中提供了完整的代码实现流程，包括数据格式转换、模型微调方法及测试代码，并开放数据集和源代码获取渠道。实验结果表明YOLOv8在行人检测任务中具有良好性能。

2025-10-13 15:55:05 1164 2

原创【工业场景】用YOLOv8实现抽烟识别

本文基于YOLOv8模型实现抽烟行为检测，使用8573张样本数据（7719张训练集、854张验证集），采用YOLO目标检测格式。通过加载预训练模型yolov8m.pt，调整参数后训练300个epoch，最终获得85%以上的检测准确率。文章详细介绍了数据准备、模型配置、训练过程和推理代码，训练结果保存在best.pt模型中。完整数据集和源代码可通过私信获取。该方法能有效识别各种场景下的抽烟行为，为禁烟监管提供技术支持。

2025-10-13 14:16:52 1489 1

原创【工业场景】用YOLOv8实现人员打电话识别

本文基于YOLOv8实现了一种人员打电话行为识别系统。研究使用包含11288张样本的自建数据集（训练集10160张，验证集1128张），采用YOLOv8m模型进行训练，通过迁移学习方式微调模型参数。实验结果表明，该系统检测准确率达到90%以上（AP50指标）。文章详细介绍了从数据准备、模型选择、训练过程到结果评估的全流程方法，包括数据集的YOLO格式转换、模型参数调整、训练日志分析等关键步骤，并提供了完整的训练和推理代码实现方案。该系统可应用于公共场所违规行为监控等场景。

2025-10-13 13:56:26 962

原创【工业场景】用YOLOv8实现反光衣识别

基于yolov8模型训练反光衣识别任务，包含数据集和完整训练+推理代码

2025-10-11 18:13:07 839

原创【gaussian-splatting】用自己的数据复现高斯泼溅（一）colmap安装bug记录

本文记录了在CentOS 7系统下安装colmap（用于高斯泼溅数据准备）的详细过程。作者首先介绍了colmap的功能及其在高斯泼溅中的作用，随后详细说明了安装环境（CentOS 7+CUDA 12.1+RTX 4090）。文章重点分享了安装colmap所需的依赖项（如ceres-solver、faiss等）的安装方法，以及通过源码编译安装colmap的具体步骤。最后提供了验证安装是否成功的方法。作者表示安装过程耗时2天，整理此文档旨在为遇到类似问题的开发者提供参考。

2025-08-14 10:28:06 1415

原创【gaussian-splatting】用自己的数据复现高斯泼溅（二）

本文介绍了3D高斯渲染项目diff-gaussian-rasterization的环境配置、训练流程及结果查看方法。关键步骤包括：1）下载正确的3dgs_accel版本diff-gaussian-rasterization（避免main版本导致的参数错误）；2）安装依赖库glm、simple-knn和fused-ssim；3）完成30000次迭代训练后，结果保存在output目录的point_cloud.ply文件中。重点提示：必须使用指定版本库，否则会报"antialiasing"参数

2025-08-06 19:33:01 1420

原创【检索定位】系列第一弹：MuSe-Net解析，含论文和代码下载链接

检索定位系列第一弹：MuSe-Net解析，含论文和代码下载链接

2025-06-16 15:06:23 1032

原创【红外】用SIRST数据集复现图像小目标分割HCFNet-附数据集和python代码

红外小目标检测是一项重要的计算机视觉任务，涉及对红外图像中微小物体的识别和定位，这些图像通常仅包含几个像素。然而，由于物体的体积很小，而且红外图像中的背景通常很复杂，因此遇到了困难。在本文中，我们提出了一种深度学习方法 HCF-Net，该方法通过多个实用模块显著提高了红外小目标检测性能。具体来说，它包括并行补丁感知注意力（PPA）模块、维度感知选择性集成（DASI）模块和多扩张通道精简器（MDCR）模块。PPA 模块使用多分支特征提取策略来捕获不同尺度和级别的特征信息。DASI 模块。

2025-05-13 14:25:58 1741

原创【超分辨率】A Spectral Diffusion Prior for Hyperspectral ImageSuper-Resolution论文复现（含python代码）

论文提出了一种基于融合的高光谱图像（HSI）超分辨率方法，名为“Spectral Diffusion Prior（SDP）”，旨在通过融合低空间分辨率的HSI和高空间分辨率的多光谱图像（MSI）来生成高空间分辨率的HSI。

2025-05-06 16:08:52 920

原创【红外】复现PIAFuison网络，含Python代码和数据集

红外和可见光图像融合旨在合成单个融合图像，即使在极端照明条件下，也能包含突出的目标和丰富的纹理细节。然而，现有的图像融合算法未能在建模过程中考虑照明因子。在本文中，我们提出了一种基于照明感知的渐进式图像融合网络，称为 PIAFusion，它可以自适应地保持突出目标的强度分布，并在背景中保留纹理信息。具体来说，我们设计了一个照明感知子网络来估计照明分布并计算照明概率。此外，我们利用照明概率构建照明感知损失来指导融合网络的训练。跨模态差分感知融合模块和中途融合策略。

2025-04-22 15:41:40 1017 1

原创【HuggingFace】查找、下载数据和模型（小白都能会）

HuggingFace 被视为 AI 模型界的 GitHub，通过开放的社区文化和丰富的资源，推动了机器学习技术的普及和创新。：拥有超过 150 万个开源 AI 模型，涵盖自然语言处理（如 BERT、GPT）、计算机视觉、音频处理和多模态任务。通过以上步骤，就可以轻松查询和下载 Hugging Face 上的模型和数据集了，并在本地使用。：支持多种预训练模型，如 BERT、GPT、T5 等，适用于文本分类、生成、问答等任务。，旨在帮助开发者和研究人员快速使用、训练和部署 AI 模型。

2025-04-11 16:26:06 1738

原创【工业场景】用YOLOv8实现非机动车及驾驶人佩戴安全帽检测

0：安全帽1: 驾驶人未戴安全帽2：驾驶人戴安全帽3：非机动车部分影像展示如下：label为txt格式的yolo目标检测格式，示例txt文件内容为：训练验证比例可以自行调整，这里不赘述。

2025-04-10 09:49:52 2160

原创【工业场景】用YOLOv12实现饮料类别识别

饮料类别识别数据集为特定场景下的15种常见饮料，部分影像展示如下：label为txt格式的yolo目标检测格式，示例txt文件内容为：训练验证比例可以自行调整，这里不赘述。

2025-04-02 14:21:48 1607 8

原创【Geoseg】工程复现+训练自己的数据

近年来，深度学习算法，特别是基于全卷积网络（FCN）的方法，在遥感领域变得非常流行。然而，这些方法通常在不同的数据集和深度学习框架中实现和评估，缺乏。

2025-04-01 15:54:07 2111

原创【YOLOv12改进trick】DynamicTanh（DyT）模块引入YOLOv12，实现涨点和效率提升，含创新点Python代码

🍋模块🍋模块通过通过模仿（如tanh函数的S形曲线），在的情况下实现。🍋🍋：DynamicTanh即插即用适用于注意力块、FFN块和最终归一化层，尽管它可能看起来像是激活函数，但在这篇研究中不会改变原始架构中激活函数的任何部分，网络的其他部分也保持不变。🍋🍋：医学影像分割、语义分割、目标检测、图像分类🍋思路来源何恺明LeCun联手打造，论文已入选。

2025-04-01 09:36:47 533

原创【TransAttUnet】 Multi-level Attention-guided U-Netwith Transformer for Medical Image Segmentation

本文介绍了一种名为的新型网络，该网络，并融合了和，旨在提高医学图像分割的准确性。文章详细阐述了TransAttUnet的设计原理、结构组成以及在多个医学图像分割数据集上的实验验证，并与其他先进方法进行了比较。

2025-03-21 10:08:56 1124

原创【色调转换】应用于图像风格转换、匀光匀色等场景

首先看效果，支持SAR影像色调统一、光学遥感影像色调统一、自然影像色调统一。：色调参考图：待处理的图：色调转换后的处理结果图色调转换的算法将其封装成可执行程序exe文件，直接双击打开即可在软件界面上实现该功能。

2025-03-21 09:29:19 978

原创【YOLOv12改进trick】自注意力模块ScaledDotProductAttention（TSA）引入YOLOv12，实现涨点和效率提升，含创新点Python代码

🍋自注意力模块🍋🍋：ScaledDotProductAttention模块通过和表示来提高医学图像分割的准确性和效率。🍋🍋：在ScaledDotProductAttention中，用Transformer中的多头自注意力机制，能够捕获输入特征之间的长距离依赖关系，帮助模型理解，从而提高分割的准确性。。🍋适用场景🍋：医学影像分割、语义分割、目标检测、图像分类🍋。

2025-03-20 09:18:33 217

原创【FPS】图像预测代码添加FPS计算

给任意一段预测代码添加FPS计算的万能公式。

2025-03-18 14:00:20 604

原创【语义分割YOLO格式label可视化】YOLO格式txt文件label可视化，含python代码

第一部分为类别信息，用数字表示，从0开始第二部分为多边形边界坐标点信息，取值范围为归一化后的[0,1]示例语义分割的YOLO格式txt文件如下，共有2个目标对象：用python代码实现语义分割YOLO格式txt文件的label可视化成如下效果。

2025-03-12 17:09:28 621

原创【从YOLO格式label中裁剪原图】根据txt格式检测结果或label文件从原图中裁剪出目标

依据目标检测结果框（YOLO格式txt）或label从原图中裁剪目标

2025-03-12 16:40:36 481

原创【YOLOv12改进trick】专栏精选合集

YOLO系列优化改进trick大合集

2025-03-11 10:19:34 2946 4

原创【YOLOv12改进trick】通道聚合FFN模块ChannelAggregationFFN引入YOLOv12，实现涨点和效率提升，含创新点Python代码

即插即用模块通道聚合FFN模块ChannelAggregationFFN引入YOLOv12，含Python代码修改

2025-03-10 15:10:16 585

原创【YOLOv12改进trick】多节门控聚合模块MultiOrderGatedAggregation模块引入YOLOv12，实现涨点和效率提升，含创新点Python代码

多节门控聚合模块MultiOrderGatedAggregation引入YOLOv12，即插即用模块实现快速涨点

2025-03-10 14:39:28 479

原创【YOLOv12改进trick】高效多尺度卷积注意力EMCAD_Block模块引入YOLOv12，实现涨点和效率提升，含创新点Python代码

EMCAD引入YOLOv12模块，实现高效多尺度注意力模块引入到YOLOv12中的快速涨点及效率提升

2025-03-10 14:05:00 663

原创【YOLOv12改进trick】轻量级下采样ContextGuidedBlock_Down模块替换Conv模块，创新涨点优化，含创新点Python代码

ContextGuidedBlock_Down模块替换yolov12的Conv模块，实现快速涨点

2025-03-07 17:01:31 520 2

原创【YOLOv12改进trick】优化loss函数（AdaptiveThresholdFocalLoss），含创新点Python代码，方便发论文

优化yolov12的损失函数

2025-03-07 16:11:37 1119

原创【YOLOv12改进trick】遥感图像分割MSAA多尺度特征融合模块（即插即用）引入YOLOv12中实现涨点，含创新点Python代码，方便发论文

遥感多尺度特征融合模块MSAA引入YOLOv12，涨点明显，即插即用。含Python代码修改

2025-03-07 14:15:08 807

原创【YOLOv12改进trick】医学图像分割网络CMUNeXt与C3K2结合，构建C3k2_CMUNeXt模块引入YOLOv12中实现涨点，含创新点Python代码，方便发论文

改进模块🍋🍋：CMUNeXtBlock模块和C3K3模块组合生成C3k2_CMUNeX模块替换C3K2模块，实现yolov12涨点，含Python代码

2025-03-07 11:26:00 1509

原创【YOLOv12改进trick】医学图像分割网络CMUNeXt引入YOLOv12中，增强全局上下文信息实现涨点，含创新点Python代码，方便发论文

医学图像分割CMUNeXtBlock模块引入YOLOv12,提取全局上下文信息，同时保持卷积的归纳偏差，实现涨点优化。

2025-03-07 10:35:42 815

原创【YOLOv12改进trick】三重注意力TripletAttention引入YOLOv12中，实现遮挡目标检测涨点，含创新点Python代码，方便发论文

近乎parameter-free的即插即用attention模块三重注意力TripletAttention模块，涨点很明显

2025-03-06 17:07:06 1438

原创【YOLOv12改进trick】多尺度大核注意力机制MLKA模块引入YOLOv12，实现多尺度目标检测涨点，含创新点Python代码，方便发论文

超分辨率提升的MLKA多尺度大核注意力机制引入YOLOv12，实现小目标和模糊目标检测涨点优化，含python代码修改

2025-03-06 16:11:31 1435

原创【YOLOv12改进trick】超分辨率SAFM模块替换上采样模块，引入YOLOv12，实现模糊目标检测涨点，含创新点Python代码，方便发论文

SAFM模块替换原有YOLO的上采样模块，对小目标检测、模糊目标检测涨点明显，含Python代码

2025-03-06 14:46:58 1569

原创【YOLOv12改进trick】StarBlock引入YOLOv12，创新涨点优化，含创新点Python代码，方便发论文

starblock引入YOLOv12中，简单操作实现快速涨点，含修改代码处

2025-03-06 09:57:06 1371

原创【YOLOv12改进trick】DynamicConv替换YOLOv12中的Conv模块，创新涨点优化，含创新点Python代码，方便发论文

动态卷积DynamicConv解决现有的低FLOPs模型无法从大规模预训练中受益等问题，将其引入YOLOv12，实现涨点

2025-03-05 17:38:35 1067

原创【YOLOv12改进trick】多核Inception网络PKINet，替换YOLO骨干网络，创新涨点优化，含创新点Python代码，方便发论文

多核Inception网络PKINet引入YOLOv12，含Python代码，优化涨点，发paper适用

2025-03-05 15:01:56 903

原创【YOLO12全网首发】训练+测试行人摔倒

YOLOv12训练自己的数据集，含Python代码。

2025-03-04 13:26:40 2805

ChangeFormer模型在LEVIR数据集上的预训练模型

ChangeFormer模型在LEVIR数据集上的预训练模型，可私信我私发

2025-12-19

目标检测xml文件转txt文件

目标检测中常用的标签格式之一是PASCAL VOC格式，它使用XML文件来存储标注信息。另一种常用格式是YOLO格式，它使用TXT文件来存储标注信息。以下是一个Python脚本示例，用于将PASCAL VOC格式的XML文件转换为YOLO格式的TXT文件。

2025-01-07

非煤矿山建设项目安全设施设计编写提纲

非煤矿山建设项目安全设施设计编写提纲第三部分金属非金属矿山建设项目安全设施重大变更设计编写提纲

2025-01-07

matlab模拟退火算法.txt

matlab模拟退火算法.txt

2021-08-11

遗传算法TSP.txt

matlab遗传TSP算法.txt

2021-08-11

matlab神经网络蚁群算法.txt

matlab神经网络蚁群算法.txt

2021-08-11

matlab蚁群算法tsp.txt

matlab蚁群算法tsp.txt

2021-08-11

matlab最短路.txt

matlab最短路.txt

2021-08-11

计算机网络 -计算二叉树深度

计算二叉树深度，含题目解析和 c++代码源码

2023-12-21

经典Spring 框架（Java源码）

这是 Spring 框架的所在地：所有Spring 项目的基础。Spring 框架和 Spring 项目系列通常简称为“Spring”。 Spring 提供了 Java 编程语言之外的一切，用于为各种场景和架构创建企业应用程序。请阅读参考文档的概述部分以获得更完整的介绍。

2023-12-21

Python 高阶函数编程，使用 lambda 表达式获取key，将list转成dict

用python语言如何实现使用 lambda 表达式获取key，将list转成dict

2023-12-20

圣诞节特效python代码

一键运行就可生成圣诞节的圣诞树啦

2023-12-20

GDAL-3.4.1-cp38-cp38-manylinux-2-5-x86-64.manylinux1-x86-64.whl

linux下gdal3.4.1安装包，需要python=3.8

2023-06-14

ConvNext-small-1k-224-ema.pth

ConvNext官方预训练模型（small版本）

2022-11-01

convnext-base-22k-224.pth

ConvNext官方预训练模型（base版本）

2022-11-01

dill-0.3.3-py3-none-any.whl

适用于python3.x的windows / linux安装包

2021-01-07

matlab初学者神经网路预测.txt

matlab算法

2021-08-11

matlab模拟退火算法.txt

matlab模拟退火算法

2021-08-11

matlab遗传算法.txt

matlab遗传算法.txt

2021-08-11

matlab蚁群聚类介绍.txt

matlab蚁群聚类介绍.txt

2021-08-11

pathos-0.2.7-py2.py3-none-any.whl

适用于python2.x和python3.x的任意操作系统（windows、linux）的pathos安装包

2021-01-07

multiprocess-0.70.11.1-py3-none-any.whl

适用于python3.x 的multiprocess 安装包

2021-01-07

DSFA算法数据集，可以直接用

包括DSFA（deep slow feature analysis）算法的实例数据集，可以配合我的博客内容（https://blog.youkuaiyun.com/qq_38308388/article/details/102703432）一起查看，有问题可以留言。

2020-06-30

pox-0.2.9-py3-none-any.whl

适用于python3.x的任意操作系统（windows、linux）的pox安装包

2021-01-07

ppft-1.6.6.3-py3-none-any.whl

适用于python3.x的任意操作系统（windows/linux）的ppft安装包

2021-01-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除