- 博客(269)
- 资源 (15)
- 收藏
- 关注
原创 【检索定位】系列第二弹:Game4Loc解析,含论文和代码下载链接
【摘要】厦门大学团队在AAAI2025提出基于游戏仿真的无人机地理定位新方法。针对现有数据集小规模、单一场景及完美匹配假设的局限,作者构建了GTA-UAV数据集,通过游戏引擎生成3万+张多高度(80-650m)、多姿态的无人机图像,并创新性定义部分匹配机制(正样本IOU>0.39,半正样本IOU∈[0.14,0.39])。提出加权对比学习框架Weighted-InfoNCE,利用IOU动态调整损失权重,将检索精度R@1提升20.08%,定位误差降低234米。实验表明该方法在真实场景UAV-VisLoc
2025-11-18 11:47:26
749
原创 【geopandas】计算矢量iou
本文介绍使用Python的geopandas库计算两个矢量文件要素交并比(IoU)的方法。主要步骤包括:1)加载矢量文件;2)遍历要素判断相交情况;3)计算IoU值并根据不同条件分类统计。代码实现了对完全不相交、单要素相交(阈值0.7)和多要素相交(阈值0.5)等情况的分类计数,最后输出各类统计结果。使用前需确保安装geopandas库(pip install geopandas)且文件坐标系一致。文末附完整代码和程序员节祝福。
2025-10-24 20:16:58
338
原创 [YOLOv8] 用YOLOv8实现指针式圆形仪表智能读数(四)
本文详细介绍了如何将YOLO格式分割结果(TXT文件)转换为三值输入图(0,1,2)的方法。通过Python代码实现转换过程:1)解析YOLO格式标注文件;2)使用不同颜色标识不同类别;3)生成三值灰度图并保存。代码支持批量处理,用户只需替换输入输出路径即可运行。文中还提供了数据说明和可视化效果示意图,帮助理解转换过程。该转换是将分割预测结果转化为后续处理所需格式的关键步骤。
2025-10-22 11:17:20
302
原创 【工业场景】用YOLOv8实现行人识别
本文基于YOLOv8模型实现行人检测任务,使用包含78,298张图片的数据集(训练集77,706张,验证集8,592张)。详细介绍了数据准备、模型配置(YOLOv8m)、训练过程(300 epochs)及推理实现,最终达到80%以上的检测精度(AP50)。文中提供了完整的代码实现流程,包括数据格式转换、模型微调方法及测试代码,并开放数据集和源代码获取渠道。实验结果表明YOLOv8在行人检测任务中具有良好性能。
2025-10-13 15:55:05
1088
2
原创 【工业场景】用YOLOv8实现抽烟识别
本文基于YOLOv8模型实现抽烟行为检测,使用8573张样本数据(7719张训练集、854张验证集),采用YOLO目标检测格式。通过加载预训练模型yolov8m.pt,调整参数后训练300个epoch,最终获得85%以上的检测准确率。文章详细介绍了数据准备、模型配置、训练过程和推理代码,训练结果保存在best.pt模型中。完整数据集和源代码可通过私信获取。该方法能有效识别各种场景下的抽烟行为,为禁烟监管提供技术支持。
2025-10-13 14:16:52
1371
1
原创 【工业场景】用YOLOv8实现人员打电话识别
本文基于YOLOv8实现了一种人员打电话行为识别系统。研究使用包含11288张样本的自建数据集(训练集10160张,验证集1128张),采用YOLOv8m模型进行训练,通过迁移学习方式微调模型参数。实验结果表明,该系统检测准确率达到90%以上(AP50指标)。文章详细介绍了从数据准备、模型选择、训练过程到结果评估的全流程方法,包括数据集的YOLO格式转换、模型参数调整、训练日志分析等关键步骤,并提供了完整的训练和推理代码实现方案。该系统可应用于公共场所违规行为监控等场景。
2025-10-13 13:56:26
902
原创 【gaussian-splatting】用自己的数据复现高斯泼溅(一)colmap安装bug记录
本文记录了在CentOS 7系统下安装colmap(用于高斯泼溅数据准备)的详细过程。作者首先介绍了colmap的功能及其在高斯泼溅中的作用,随后详细说明了安装环境(CentOS 7+CUDA 12.1+RTX 4090)。文章重点分享了安装colmap所需的依赖项(如ceres-solver、faiss等)的安装方法,以及通过源码编译安装colmap的具体步骤。最后提供了验证安装是否成功的方法。作者表示安装过程耗时2天,整理此文档旨在为遇到类似问题的开发者提供参考。
2025-08-14 10:28:06
1292
原创 【gaussian-splatting】用自己的数据复现高斯泼溅(二)
本文介绍了3D高斯渲染项目diff-gaussian-rasterization的环境配置、训练流程及结果查看方法。关键步骤包括:1)下载正确的3dgs_accel版本diff-gaussian-rasterization(避免main版本导致的参数错误);2)安装依赖库glm、simple-knn和fused-ssim;3)完成30000次迭代训练后,结果保存在output目录的point_cloud.ply文件中。重点提示:必须使用指定版本库,否则会报"antialiasing"参数
2025-08-06 19:33:01
1305
原创 【红外】用SIRST数据集复现图像小目标分割HCFNet-附数据集和python代码
红外小目标检测是一项重要的计算机视觉任务,涉及对红外图像中微小物体的识别和定位,这些图像通常仅包含几个像素。然而,由于物体的体积很小,而且红外图像中的背景通常很复杂,因此遇到了困难。在本文中,我们提出了一种深度学习方法 HCF-Net,该方法通过多个实用模块显著提高了红外小目标检测性能。具体来说,它包括并行补丁感知注意力(PPA) 模块、维度感知选择性集成(DASI) 模块和多扩张通道精简器(MDCR) 模块。PPA 模块使用多分支特征提取策略来捕获不同尺度和级别的特征信息。DASI 模块。
2025-05-13 14:25:58
1590
原创 【超分辨率】A Spectral Diffusion Prior for Hyperspectral ImageSuper-Resolution论文复现(含python代码)
论文提出了一种基于融合的高光谱图像(HSI)超分辨率方法,名为“Spectral Diffusion Prior(SDP)”,旨在通过融合低空间分辨率的HSI和高空间分辨率的多光谱图像(MSI)来生成高空间分辨率的HSI。
2025-05-06 16:08:52
879
原创 【红外】复现PIAFuison网络,含Python代码和数据集
红外和可见光图像融合旨在合成单个融合图像,即使在极端照明条件下,也能包含突出的目标和丰富的纹理细节。然而,现有的图像融合算法未能在建模过程中考虑照明因子。在本文中,我们提出了一种基于照明感知的渐进式图像融合网络,称为 PIAFusion,它可以自适应地保持突出目标的强度分布,并在背景中保留纹理信息。具体来说,我们设计了一个照明感知子网络来估计照明分布并计算照明概率。此外,我们利用照明概率构建照明感知损失来指导融合网络的训练。跨模态差分感知融合模块和中途融合策略。
2025-04-22 15:41:40
964
1
原创 【HuggingFace】查找、下载数据和模型(小白都能会)
HuggingFace 被视为 AI 模型界的 GitHub,通过开放的社区文化和丰富的资源,推动了机器学习技术的普及和创新。:拥有超过 150 万个开源 AI 模型,涵盖自然语言处理(如 BERT、GPT)、计算机视觉、音频处理和多模态任务。通过以上步骤,就可以轻松查询和下载 Hugging Face 上的模型和数据集了,并在本地使用。:支持多种预训练模型,如 BERT、GPT、T5 等,适用于文本分类、生成、问答等任务。,旨在帮助开发者和研究人员快速使用、训练和部署 AI 模型。
2025-04-11 16:26:06
1595
原创 【工业场景】用YOLOv8实现非机动车及驾驶人佩戴安全帽检测
0:安全帽1: 驾驶人未戴安全帽2:驾驶人戴安全帽3:非机动车部分影像展示如下:label为txt格式的yolo目标检测格式,示例txt文件内容为:训练验证比例可以自行调整,这里不赘述。
2025-04-10 09:49:52
2075
原创 【工业场景】用YOLOv12实现饮料类别识别
饮料类别识别数据集为特定场景下的15种常见饮料,部分影像展示如下:label为txt格式的yolo目标检测格式,示例txt文件内容为:训练验证比例可以自行调整,这里不赘述。
2025-04-02 14:21:48
1556
8
原创 【Geoseg】工程复现+训练自己的数据
近年来,深度学习算法,特别是基于全卷积网络(FCN)的方法,在遥感领域变得非常流行。然而,这些方法通常在不同的数据集和深度学习框架中实现和评估,缺乏。
2025-04-01 15:54:07
2063
原创 【YOLOv12改进trick】DynamicTanh(DyT)模块引入YOLOv12,实现涨点和效率提升,含创新点Python代码
🍋模块🍋模块通过通过模仿(如tanh函数的S形曲线),在的情况下实现。🍋🍋:DynamicTanh即插即用适用于注意力块、FFN块和最终归一化层,尽管它可能看起来像是激活函数,但在这篇研究中不会改变原始架构中激活函数的任何部分,网络的其他部分也保持不变。🍋🍋:医学影像分割、语义分割、目标检测、图像分类🍋思路来源何恺明LeCun联手打造,论文已入选。
2025-04-01 09:36:47
495
原创 【TransAttUnet】 Multi-level Attention-guided U-Netwith Transformer for Medical Image Segmentation
本文介绍了一种名为的新型网络,该网络,并融合了和,旨在提高医学图像分割的准确性。文章详细阐述了TransAttUnet的设计原理、结构组成以及在多个医学图像分割数据集上的实验验证,并与其他先进方法进行了比较。
2025-03-21 10:08:56
1049
原创 【色调转换】应用于图像风格转换、匀光匀色等场景
首先看效果,支持SAR影像色调统一、光学遥感影像色调统一、自然影像色调统一。:色调参考图:待处理的图:色调转换后的处理结果图色调转换的算法将其封装成可执行程序exe文件,直接双击打开即可在软件界面上实现该功能。
2025-03-21 09:29:19
957
原创 【YOLOv12改进trick】自注意力模块ScaledDotProductAttention(TSA)引入YOLOv12,实现涨点和效率提升,含创新点Python代码
🍋自注意力模块🍋🍋:ScaledDotProductAttention模块通过和表示来提高医学图像分割的准确性和效率。🍋🍋:在ScaledDotProductAttention中,用Transformer中的多头自注意力机制,能够捕获输入特征之间的长距离依赖关系,帮助模型理解,从而提高分割的准确性。。🍋适用场景🍋:医学影像分割、语义分割、目标检测、图像分类🍋。
2025-03-20 09:18:33
204
原创 【语义分割YOLO格式label可视化】YOLO格式txt文件label可视化,含python代码
第一部分为类别信息,用数字表示,从0开始第二部分为多边形边界坐标点信息,取值范围为归一化后的[0,1]示例语义分割的YOLO格式txt文件如下,共有2个目标对象:用python代码实现语义分割YOLO格式txt文件的label可视化成如下效果。
2025-03-12 17:09:28
597
原创 【从YOLO格式label中裁剪原图】根据txt格式检测结果或label文件从原图中裁剪出目标
依据目标检测结果框(YOLO格式txt)或label从原图中裁剪目标
2025-03-12 16:40:36
428
原创 【YOLOv12改进trick】通道聚合FFN模块ChannelAggregationFFN引入YOLOv12,实现涨点和效率提升,含创新点Python代码
即插即用模块 通道聚合FFN模块ChannelAggregationFFN引入YOLOv12,含Python代码修改
2025-03-10 15:10:16
542
原创 【YOLOv12改进trick】多节门控聚合模块MultiOrderGatedAggregation模块引入YOLOv12,实现涨点和效率提升,含创新点Python代码
多节门控聚合模块MultiOrderGatedAggregation引入YOLOv12,即插即用模块实现快速涨点
2025-03-10 14:39:28
452
原创 【YOLOv12改进trick】高效多尺度卷积注意力EMCAD_Block模块引入YOLOv12,实现涨点和效率提升,含创新点Python代码
EMCAD引入YOLOv12模块,实现高效多尺度注意力模块引入到YOLOv12中的快速涨点及效率提升
2025-03-10 14:05:00
639
原创 【YOLOv12改进trick】轻量级下采样ContextGuidedBlock_Down模块替换Conv模块,创新涨点优化,含创新点Python代码
ContextGuidedBlock_Down模块替换yolov12的Conv模块,实现快速涨点
2025-03-07 17:01:31
489
2
原创 【YOLOv12改进trick】优化loss函数(AdaptiveThresholdFocalLoss),含创新点Python代码,方便发论文
优化yolov12的损失函数
2025-03-07 16:11:37
1025
原创 【YOLOv12改进trick】遥感图像分割MSAA多尺度特征融合模块(即插即用)引入YOLOv12中实现涨点,含创新点Python代码,方便发论文
遥感多尺度特征融合模块MSAA引入YOLOv12,涨点明显,即插即用。含Python代码修改
2025-03-07 14:15:08
714
原创 【YOLOv12改进trick】医学图像分割网络CMUNeXt与C3K2结合,构建C3k2_CMUNeXt模块引入YOLOv12中实现涨点,含创新点Python代码,方便发论文
改进模块🍋🍋:CMUNeXtBlock模块和C3K3模块组合生成C3k2_CMUNeX模块替换C3K2模块,实现yolov12涨点,含Python代码
2025-03-07 11:26:00
1467
原创 【YOLOv12改进trick】医学图像分割网络CMUNeXt引入YOLOv12中,增强全局上下文信息实现涨点,含创新点Python代码,方便发论文
医学图像分割CMUNeXtBlock模块引入YOLOv12,提取全局上下文信息,同时保持卷积的归纳偏差,实现涨点优化。
2025-03-07 10:35:42
795
原创 【YOLOv12改进trick】三重注意力TripletAttention引入YOLOv12中,实现遮挡目标检测涨点,含创新点Python代码,方便发论文
近乎parameter-free的即插即用attention模块三重注意力TripletAttention模块,涨点很明显
2025-03-06 17:07:06
1392
原创 【YOLOv12改进trick】多尺度大核注意力机制MLKA模块引入YOLOv12,实现多尺度目标检测涨点,含创新点Python代码,方便发论文
超分辨率提升的MLKA多尺度大核注意力机制引入YOLOv12,实现小目标和模糊目标检测涨点优化,含python代码修改
2025-03-06 16:11:31
1376
原创 【YOLOv12改进trick】超分辨率SAFM模块替换上采样模块,引入YOLOv12,实现模糊目标检测涨点,含创新点Python代码,方便发论文
SAFM模块替换原有YOLO的上采样模块,对小目标检测、模糊目标检测涨点明显,含Python代码
2025-03-06 14:46:58
1519
原创 【YOLOv12改进trick】StarBlock引入YOLOv12,创新涨点优化,含创新点Python代码,方便发论文
starblock引入YOLOv12中,简单操作实现快速涨点,含修改代码处
2025-03-06 09:57:06
1317
原创 【YOLOv12改进trick】DynamicConv替换YOLOv12中的Conv模块,创新涨点优化,含创新点Python代码,方便发论文
动态卷积DynamicConv解决现有的低FLOPs模型无法从大规模预训练中受益等问题,将其引入YOLOv12,实现涨点
2025-03-05 17:38:35
1042
原创 【YOLOv12改进trick】多核Inception网络PKINet,替换YOLO骨干网络,创新涨点优化,含创新点Python代码,方便发论文
多核Inception网络PKINet引入YOLOv12,含Python代码,优化涨点,发paper适用
2025-03-05 15:01:56
886
目标检测xml文件转txt文件
2025-01-07
经典Spring 框架(Java源码)
2023-12-21
GDAL-3.4.1-cp38-cp38-manylinux-2-5-x86-64.manylinux1-x86-64.whl
2023-06-14
DSFA算法数据集,可以直接用
2020-06-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅