自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (2)
  • 收藏
  • 关注

原创 超简单搭建AI去水印和图像修复算法lama-cleaner二

【代码】超简单搭建AI去水印和图像修复算法lama-cleaner二。

2025-12-15 11:37:19 341

原创 超简单搭建AI去水印和图像修复算法lama-cleaner(包含网页UI单张操作和代码批量运行)一

以及比较重要的一些库以及对应的版本:torch, huggingface_hub,diffusers,transformers,lama-cleaner。1_mask.jpg是单通道的掩膜图(jpg或者png), 要扣除的区域设置为白色, 其他不扣除的区域设置为黑色.浏览器输入网址即可使用, 上传一张图, 手动涂抹不想要的区域即可.(如果没有1_mask.jpg图, 可以参考下面的。的代码, 手动生成1_mask.jpg的图)(可以自行选择模型, 测试哪个效果更好)(长按ctrl可以进行多处消除涂抹)

2025-12-15 11:36:04 624

原创 CVAT平台安装和半自动标注搭建

先修改要部署的模型的function.yaml或者function-gpu.yaml文件,把opencv-python, torch等库用清华源来安装,因为这种库从官网安装会超级慢。如果要安装cvat其他版本,需要把之前安装好的docker容器关闭和删除,docker镜像也要删除,只保留nvidia/cuda的镜像。注意: 如果对docker composose文件做了任何更改,或者运行上述指令无法全部启动服务,需要在末尾添加–build, 重建serverless框架。

2025-12-12 11:23:18 1016

原创 Nvidia Jetson Orign NX(cuda12, arrch64)安装D435和D435i摄像头 pyrealsense2库

执行完这一步之后, 再测试一遍, 我已经可以正常在python代码中导入 pyrealsense2库, python能正常调用运行.python代码运行过程中出现缺什么库就安装什么库, arrch64上安装库的方式跟x86电脑环境的安装方式是差不多的.

2025-10-30 16:08:41 771

原创 NVIDIA Jetson Orin NX安装graspnet和graspnetAPI失败解决方案

NVIDIA Jetson Orin NX安装graspnet参考git网址。

2025-10-29 19:20:03 185

原创 NVIDIA Jetson Orin NX (Ubuntu 22.04, JetPack 6.2, CUDA 12 cuDnn9) 上成功安装torch2和torchvision

本文介绍了在NVIDIA Jetson Orin NX上安装PyTorch 2.5.0和torchvision 0.20的三种方案,其中推荐使用预编译的whl文件安装。同时提供了cuSPARSELt库的安装方法,并解决了因NumPy版本不兼容导致的错误问题。文章还指出当前JetPack 6.2尚未有官方适配的PyTorch 2版本,建议等待官方更新。通过详细的安装步骤和错误处理方法,帮助用户在Jetson平台上成功搭建PyTorch环境。

2025-10-28 15:49:37 983

原创 一.Yolov8量化感知训练微调(QAT)第三篇: 感知量化训练QAT,onnx导出,engine导出

int8 --fp16: 启用INT8(8位整数)和–fp16量化精度, 对不支持量化的层默认转fp16. 如果模型finetune时, 全部层都做了int8量化, 那么只需要–int8即可;–workspace=4096 : 转engine模型用到, 模型小可以设置1024, 但如果模型大, 要设置大一些, 例如2048, 4096, 8192等,但不能大于GPU显存大小.可以自行设置, 例如设置成768 1024, 即导出的onnx模型的h=768, w=1024.有些层转量化会影响精度.

2025-10-23 10:19:14 927

原创 在NVIDIA Jetson Orin NX (Ubuntu 20.04, JetPack 5.1, CUDA 11 cuDnn8) 上安装PyTorch 2

摘要 本文介绍了在NVIDIA Jetson Orin NX开发板上安装PyTorch 2 GPU版的方法。环境为Ubuntu 22.04 + JetPack 5.1 + CUDA 11 + cuDNN8。使用Miniforge创建conda虚拟环境后,重点强调必须确保开发板信息(通过jtop查看)与PyTorch版本严格对应。建议从NVIDIA开发者论坛下载匹配的.whl文件(如torch-2.1.0),通过pip进行本地安装。文末提供了验证安装的测试命令和参考链接。

2025-10-17 15:04:26 524

原创 NVIDIA Jetson Orin NX 安装Miniforge的Conda和Anaconda3并存切换使用

本文介绍了在Jetson边缘设备(ARM64架构)上安装Miniforge并与原有Anaconda3并存的方法。主要内容包括:1)下载Miniforge安装脚本;2)备份原有conda配置;3)将Miniforge安装到独立目录;4)创建切换脚本实现两个conda环境的管理;5)解决conda环境混淆问题的方法。特别针对Jetson设备ARM架构的兼容性问题,提供了清除国内镜像源、仅保留conda-forge官方频道的解决方案,创建use_miniforge.sh和use_anaconda.sh实现切换.

2025-10-17 15:00:05 446

原创 一.Yolov8量化感知训练微调(QAT)第二篇: 单batch和多batch导出onnx和engine模型 (Tensorrt推理)

一.最最最重要的官方ultralytics量化速度信息二.设置onnx模型导出的输出头数量和输出头维度三. 设置单batch和多batch的onnx模型导出四. onnx导出为tensorrt的engine模型五. 验证tensorrt的engine模型六. 额外知识点

2025-10-11 15:08:00 1294

原创 一.Yolov8量化感知训练微调(QAT)第一篇:QAT原理和微调训练流程

量化感知训练(QAT)是一种先进技术,它弥合了高精度浮点模型与适用于资源受限硬件部署的高效低精度整数模型之间的差距。在原先检测模型背景下,QAT使模型能够保持其检测精度,同时通过TensorRT优化显著提高推理性能。量化是将模型权重和激活值从高精度(通常是32位浮点)转换为低精度(如8位整数)的过程。减少内存占用:INT8模型所需的内存比FP32模型少约4倍更快推理:在大多数硬件上,整数运算的计算成本更低且速度更快能源效率:低精度计算消耗更少的电量,使其成为移动设备和边缘设备的理想选择。

2025-09-23 18:37:19 1332

原创 yolov8/yolov11 obb的pt转onnx再转engine, 并支持onnx和engine模型多batch推理

由于要用到trtexec,而trtexec在/usr/src/tensorrt/bin目录下,每次执行,需要cd到该目录下执行下面的代码,这样有点麻烦,可以创建软链接放到要执行指令的目录下即可。yolov8/yolov11 bb如何转出多 batch 的模型, 以及修改onnx模型输出维度.但是这样的维度不⽅便用Tensorrt进行本地代码部署和解析。(找到对应的代码, 大约在409行左右, 注释这段代码, 添加修改后的代码)那么, 需要修改代码, 把修改输入和输出节点名和多batch推理。

2025-09-23 16:05:19 728

原创 Linux 文件搜索神器Fsearch (Windows版Everything)

Ubuntu系统安装使用Fsearch快速搜索工具 本文介绍在Ubuntu 18.04/20.04系统安装Fsearch文件搜索工具的步骤:1)通过PPA源安装(sudo add-apt-repository ppa:christian-boxdoerfer/fsearch-stable); 2)在软件设置中添加需要搜索的目录路径; 3)当文件变动时需手动更新数据库。Fsearch提供图形化界面操作简便,适合快速查找本地文件。文中配有软件设置界面示意图,帮助用户直观了解操作流程。

2025-08-13 18:24:54 653

原创 1.高光谱数据集深度学习分类和代码分析(代码优化, 提升精度)二

本文针对高光谱图像分类算法进行了三项主要优化:1)改进了数据集加载方式,采用批量加载并按类别组织数据,同时统一生成3×3×30的patch作为输入;2)优化了网络结构,移除了MaxPooling和GlobalAveragePooling层以减少空间信息损失,并简化了模型深度;3)在训练过程中加入了早停机制和模型保存功能以防止过拟合。实验结果表明,这些优化有效提升了分类精度,训练准确率达到98.33%,验证准确率达到96.67%。该优化方法特别适合处理小尺寸patch的高光谱数据分类问题。

2025-08-13 18:23:09 920

原创 1.高光谱数据集深度学习分类和代码分析(实践代码)一

本文摘要: 本文实现了一个基于2D-CNN的高光谱图像分类模型,针对Salinas数据集进行农作物分类。主要流程包括:1)环境配置与随机种子固定;2)GPU选择与显存优化;3)数据加载与预处理,包括PCA降维至30维;4)3×3光谱-空间patch生成;5)数据划分与类别平衡处理;6)构建包含Conv-BN-MP层的CNN模型;7)训练评估与整图预测可视化。创新点在于采用PCA降维降低数据维度,通过空间上下文patch提取提升分类性能。实验表明该方法能有效处理高光谱数据,最终测试准确率达95%以上。未来可尝

2025-08-01 18:10:00 1386 2

原创 如何通过黑白棋盘进行定位配准融合?(前后安装的两个相机)

本文介绍了基于双相机系统的图像配准与融合技术流程。硬件上采用两台线扫描相机和黑白棋盘格板,通过调节传送带速度实现空间分辨率统一。算法核心包含Harris角点检测、亚像素优化和透视变换,利用棋盘格角点进行图像配准,通过RANSAC算法估计单应性矩阵实现两相机图像的几何对齐。最终生成映射查找表(LUT)用于实时图像融合,并提供了误差分析方法验证配准精度。该方案适用于传送带场景下的多相机图像配准,通过空间统一和几何变换实现高精度图像融合。

2025-08-01 18:05:08 1058

原创 二.高光谱数据的hdr和spe和bmp文件说明

高光谱图像数据通常由.hdr头文件、.spe数据文件和.bmp伪彩色图像组成。.hdr文件包含关键元数据,如图像尺寸、波段数、数据类型和波长信息;.spe是二进制格式的原始光谱数据,采用BIL/BSQ/BIP三种排列方式;.bmp用于可视化。读取数据时需要根据.hdr的元信息(如interleave排列方式)正确解析.spe文件。该数据可用于光谱分析、目标识别等应用,典型参数包括图像宽度(samples)、高度(lines)、波段数(bands)及各波段对应的物理波长。

2025-07-25 05:53:35 1880

原创 一.理解高光谱数据的波段、波长、反射率、光谱曲线、平均光谱曲线之间的关系

高光谱遥感中的关键概念及关系: 波段:图像数据的通道维度,每个波段记录特定波长范围的反射率值; 波长:电磁波的物理属性,单位纳米,与波段一一对应; 反射率:物体反射能量与入射能量之比,是波段记录的核心数据; 光谱曲线:单个像素在各波段反射率值连成的曲线(波长-反射率); 平均光谱曲线:同一类像素在各波段的平均反射率曲线。 波段数量决定光谱分辨率,波长对应波段中心值,反射率构成光谱特征,曲线反映物质特性。平均光谱曲线可降噪并提取分类特征波段。

2025-07-25 05:51:42 2361

原创 五. 以聚类和搜图方式清洗图像数据集,采用Pickle和Faiss(百万数据集,ms级响应)快速搜图(附完整代码)

一. 总结Faiss 和 Pickle 优缺点和适用场景。二. 将图像特征打包成 pickle 文件(Python 的序列化格式),匹配搜图(附完整代码)。三. 将图像特征打包成faiss的index索引文件,匹配搜图(附完整代码)。四. 先用Pickle保存图像特征,再用Faiss构建索引(更灵活)(附示例代码)。

2025-04-19 21:47:55 1125

原创 四. 以Annoy算法建树的方式聚类清洗图像数据集,一次建树,无限次聚类搜索,提升聚类搜索效率。(附完整代码)

(1)通过多次递归迭代,建立一个二叉树,以二叉树的方式,提升数据聚类和搜索速度,但会损失一些精度。(2)建树过程相对比较耗时,但建树只需要一次,部署到线上或者其他设备上,能无数次聚类搜索。(类似于人脸识别的人脸底库)

2025-04-19 07:25:11 665

原创 三.以聚类和搜图方式清洗图像数据集,先找到最佳聚类类别数,再进行有效聚类 (图像特征提取+Kmeans聚类)(附案例代码)

(1)对向量数据找最佳聚类类别数,以确定聚类的最佳效益,最好的效果。(2)对聚类完图像特征后,从每个聚类文件夹里面取小图,并根据小图名找到对应的大图,用这样方式取到的图的类别均衡,且是最有效的图,每次新的数据集进来,都可以以这样的方式对图像进行筛选。

2025-04-01 22:01:00 814

原创 二.以聚类和搜图方式清洗图像数据集,解决图像冗余和不均衡问题 (图像特征提取+Kmeans聚类篇)(附案例代码)

一. 简单Kmeans聚类例子, 样本是针对向量数据二. 提取图像特征,Kmeans对图像特征进行聚类三. 解决图像数据样冗余和不均衡问题

2025-04-01 21:55:35 523

原创 一.以聚类和搜图方式清洗图像数据集 (Kmeans和DBscan聚类原理篇)

(1) Kmeans会强制要求每个类有个聚类,一些异常点也会强制归类,而DBscan会剔除一些异常点(噪声点),更符合我们对数据的聚类。因为异常点(噪声点)会影响聚类的中心点。(2) Kmeans上手容易, 但对初始值敏感, DBscan效果好,但不好调参。(3) Kmeans可多线程跑, 聚类快; DBscan运算量大,且不能用线程分布式处理。

2025-03-24 22:30:00 305

原创 Yolo导出onnx,关于opset版本和simplify参数设置

一. yolo导出onnx关于opset版本设置。二. yolo导出onnx关于simplify参数设置。三. yolo导出onnx进行推理和pt推理对比。

2025-02-06 22:32:42 3352

原创 (亲测有效)Google的Chrome浏览器在Window电脑打开后无法联网,2种解决方式!

第一种方案:(推荐解决方案,亲测有效) Chrome不兼容以前版本的Window版本,对Chrome.exe进行属性管理,再根据下面图像内容进行一步步操作,再重新启动Chrome即可解决。

2024-11-25 17:02:31 3931 2

原创 用于参数和计算效率的超细粒度图像识别的降采样插入层适配器

超细粒度图像识别对类别间差异极小的对象进行分类,区分同一物种内的品种。为了应对每个类别的样本稀缺等挑战,论文引入了一种新颖的方法,采用下采样层间适配器,其中主干网络参数被冻结,仅微调一小部分附加模块。通过整合双分支下采样,显著减少了所需的参数数量和浮点运算次数。在10个数据集上的全面实验表明,该方法在准确性和成本性能方面取得了卓越的成绩。特别是,与其他参数高效设置中的方法相比,我们的方法将平均准确率提高了至少6.8%,可训练参数至少减少了123倍,与最先进的UFGIR方法相比,平均FLOPs减少了30%。

2024-09-18 14:19:38 1243

原创 基于极细粒度的字形视觉分类

为了解决自然场景字形之间相似性挑战,论文引入了两个非常细粒度的视觉识别数据集。论文提出了一个简单而有效的两阶段的对比学习方法:第一阶段,利用监督对比学习来利用标签信息来预热骨干网络;第二阶段,介绍了CCFG-Net,它集成了欧氏空间和角空间中的分类和对比学习的网络架构,其中对比学习应用于监督学习和成对判别方式,以增强模型的特征表示能力。论文提出的方法有效地利用了对比学习和分类的互补优势,提高了相似字形的识别性能。与CNN和Transformer骨干下的最先进的细粒度分类方法比较评估,证明了该方法的优越性。

2024-09-14 15:08:49 1259

原创 yolov8 obb算法中的GBB和ProbIoU核心内容

大多数目标检测方法使用边界框来编码和表示物体形状和位置,本论文中使用高斯分布对物体区域进行模糊表示,还提出了一种基于Hellinger距离的相似性度量,称为概率交并比(ProbIoU),可以视为一种概率形式的IoU。实验结果表明,所提出的高斯表示与公开可用数据集中的标注分割掩码更为接近,且基于ProbIoU的损失函数可以成功用于回归高斯表示的参数。此外,本论文提出了一个从传统(或旋转的)边界框到高斯表示的简单映射方案,允许将所提出的基于ProbIoU的损失无缝集成到任何目标检测器中。

2024-09-13 14:19:47 3236

原创 在半监督学习中,用于细粒度图像分类中精确增强的伪标记方法

这篇文章主要解决的问题是细粒度图像分类中的标注数据稀缺问题。该问题的研究难点包括:标注数据稀缺、细粒度特征的分辨难度大、标准数据增强和图像混合技术会破坏关键的细粒度特征。文章的方法是通过生成高质量的伪标签用到大量的未标注数据上,并通过两个关键阶段逐步优化这些伪标签:初始伪标签生成和混合语义伪标签生成。这两个阶段利用类激活图(CAMs)准确估计语义内容,并生成捕捉细粒度分类所需关键细节的精细标签。通过关注语义级信息,该方法有效地解决了标准数据增强和图像混合技术在保留关键细粒度特征方面的局限性,提升分类精度。

2024-09-12 17:31:37 1345 1

原创 通过特征幅度正则化,增强少数据情况下的细粒度识别精度

本文提出了一种名为特征幅度正则化(FMR)的新方法,用于改善少数据场景下的细粒度图像识别。FMR通过均衡特征幅度,解决了预训练模型中存在的特征幅度偏差问题。该方法根据特征幅度分布动态调整正则化强度,从而获得更平衡的特征表示并提高模型性能。实验结果表明,FMR在各种数据集上的性能均优于传统的微调方法,展示了其在具有挑战性的数据有限环境中的潜力。

2024-09-10 12:20:21 1413

原创 把网页保存成PDF或者输出打印时,有2款好用的网页插件值得安利。(不一定每个人用的上)

想把网页保存成PDF或者输出给打印时,有2款网页插件值得推荐:(在网页扩展中安装)(先安利一个AI算法论文和代码的网站:https://paperswithcode.com)

2024-09-06 16:53:27 3088

原创 Linux系统安装多个CUDA版本与切换,正常AI模型训练

如果已经安装了NVIDIA驱动版本,先卸载旧驱动,再安装新CUDA对应的驱动,如果没有安装过NVIDIA驱动版本,可以直接安装新CUDA版本,它会自动安装对应的NVIDIA驱动。(2)执行nvidia-smi命令,显示是cuda的版本号(每个cuda版本对应了不同驱动版本),提供有关系统中NVIDIA GPU的实时状态信息。一个带显卡的环境系统能安装多个CUDA版本,但不能安装多个NVIDIA驱动版本,多个驱动版本会导致冲突,NVIDIA驱动能向下兼容CUDA版本,但不能向上兼容CUDA版本。

2024-07-24 17:44:04 3508 2

影刀代码迁移工具,能正常迁移项目,目前已验证,影刀5.31.28版本能正常迁移到其他用户下,其他用户能正常使用

目前已验证,影刀5.31.28版本能正常迁移到其他用户下,其他用户能正常使用。 教程: 1、在开发者设备选择任意应用 2、点击一键迁移按钮 3、输入接收方的影刀账号密码 4、完成迁移,通知接收方登录影刀,双击应用完成同步

2025-11-04

预训练的分类模型,用于《二.以聚类的方式清洗图像数据集 (图像特征提取+Kmeans聚类篇)》的文章里,用于提取图像特征进行聚类

预训练的分类模型,用于《二.以聚类的方式清洗图像数据集 (图像特征提取+Kmeans聚类篇)》的文章里,用于提取图像特征进行聚类

2025-03-25

label.png图像16位或24位转8位,用于Mask Rcnn训练(绝对可用)

(代码简洁, 绝对可用)使用python将24位或者16位图像转换为8位图像,用于labelme标记的MASK_RCNN进行样本训练, 自己的样本数据是24位就是用这代码进行转换成8位, 样本已训练成功.(16位亦可用).

2019-07-13

已经编译了contrib的opencv3.2.0

已经编译了扩展模块opencv_contrib的opencv3.2.0下载链接,人脸识别等处理需要配置这个版本的opencv。

2017-11-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除