自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(65)
  • 收藏
  • 关注

原创 YOLOv8--绘制中文标签耗时优化

整个绘制中文标签的流程通过初始化字体和颜色、创建并管理字符图像缓存,最终将缓存的字符图像高效地绘制到目标图像上,利用缓存机制减少了重复绘制和字体渲染的开销,提高了绘制效率。

2025-03-30 16:59:49 692

原创 基于YOLOv8的PCB缺陷检测--补充实验

印刷电路板(PCB)瑕疵数据集:是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。本文我们选取了其中适用与检测任务的693张图像,随机选择593张图像作为训练集,100张图像作为验证集。

2025-03-30 14:22:42 1032

原创 Vision Transformer结构与代码详解

在图像分类中,Vision Transformer (ViT)主要包括几个阶段。在图像分类任务中,重点在于提取图像的整体特征以判断类别,编码器足以完成特征提取的任务,所以无需解码器。

2025-03-20 19:51:14 819 2

原创 【超详细】DEIM:最强实时目标检测算法-Visdrone2019无人机数据集实战

VisDrone数据集是由天津大学等团队开源的一个大型无人机视角的数据集,官方提供的数据中训练集是6471、验证集是548、测试集1610张。数据集共提供了以下12个类,分别是:‘忽略区域’, ‘pedestrian’, ‘people’, ‘bicycle’, ‘car’, ‘van’,‘truck’, ‘tricycle’, ‘awning-tricycle’, ‘bus’, ‘motor’, ‘others’,其中忽略区域、others是非有效目标区域,本项目中予以忽略,

2025-01-09 22:58:48 4798 13

原创 【超详细】YOLOv8/11损失函数改进-添加Wise-IoU/MPDIoU/ShapeIoU/Inner-IoU等—Visdrone2019数据集

注意:使用yolo命令训练,需对修改后的整个代码运行pip install -e .2.1 步骤一:新增导入库。

2025-01-03 11:27:59 3365 23

原创 【超详细】基于ultralytics代码训练YOLOv5/8/9/10/11s—Visdrone2019数据集

VisDrone数据集是由天津大学等团队开源的一个大型无人机视角的数据集,官方提供的数据中训练集是6471、验证集是548、测试集1610张。数据集共提供了以下12个类,分别是:‘忽略区域’, ‘pedestrian’, ‘people’, ‘bicycle’, ‘car’, ‘van’,‘truck’, ‘tricycle’, ‘awning-tricycle’, ‘bus’, ‘motor’, ‘others’,其中忽略区域、others是非有效目标区域,本项目中予以忽略;详情见文章1和2。

2024-11-27 23:26:03 1841 7

原创 Atlas800昇腾服务器(型号:3000)—Docker容器部署【图像分类】(十)

(2)导出requirements.txt文件【这里剔除ais_bench相关】(4)构建镜像-名字images_classfication:0001.rc。:鲲鹏 CPU(ARM64)+A300I pro推理卡。(2)启动容器,直接运行脚本:【(1)启动容器,进入终端:【开发套件:版本7.0.1【(5)查看镜像是否存在。

2024-10-28 00:38:59 1425

原创 Atlas800昇腾服务器(型号:3000)—SwinTransformer等NPU推理【图像分类】(九)

mmcls图像分类模型库丰富,涵盖最新的图像分类算法,且安装一个环境,可用一个脚本转onnx模型!(8)Vision Transformer【运行成功】(9)SwinTransformer【运行成功】(1)ShuffleNetv2【运行成功】(3)EfficientNet【运行成功】(4)MobileNetv2【运行成功】(5)MobileNetv3【运行成功】(7)SE-ResNet【运行成功】(1)创建环境和安装pytorch。(2)DenseNet【运行成功】(6)ResNet【运行成功】

2024-10-27 23:39:19 1120

原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【跟踪】(八)

目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。加速后前处理+推理大约10ms左右,bytetrack跟踪耗时2-3ms。:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.有时候,直接pip安装即可,报错的话,去python库官网下载压缩包安装。开发套件:版本7.0.1【

2024-10-19 23:35:10 1403

原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【关键点】(七)

目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。YOLOv8s未使用AIPP进行前处理加速,前处理+推理大约20ms左右;:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.:鲲鹏 CPU(ARM64)+A300I pro推理卡。开发套件:版本7.0.1【

2024-10-19 23:27:13 949

原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【实例分割】(六)

目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。YOLOv8s未使用AIPP进行前处理加速,前处理+推理大约20ms左右;加速后前处理+推理大约10ms左右,画mask耗时较长。:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.开发套件:版本7.0.1【

2024-10-19 23:22:58 857

原创 Atlas800昇腾服务器(型号:3000)—CANN安装(二)

安装后的路径(以root用户默认安装路径为例):“/usr/local/Ascend/ascendtoolkit/latest/opp/built-in/op_impl/ai_core/tbe/kernel”。二进制算子包依赖CANN软件包Toolkit,执行安装时,当前环境需已安装配套版本的。安装完成后,若显示xxx install success,则说明软件安装成功。否则请执行如下安装命令(如果只有部分软件未安装,则如下命令修改为还未安装的。以上,CANN安装完毕,可以进行om模型转换!

2024-10-17 00:20:31 1280

原创 Atlas800昇腾服务器(型号:3000)—AIPP加速前处理(四)

AIPP(Artificial Intelligence Pre-Processing)人工智能预处理,用于在AI Core上完成数据预处理,包括改变图像尺寸、色域转换(转换图像格式)、减均值/乘系数(改变图像像素),数据预处理之后再进行真正的模型推理。该模块功能与DVPP相似,都可以实现媒体数据处理的功能,两者的功能范围有重合,比如改变图像尺寸、转换图像格式,但功能范围也有不同的,比如DVPP可以做图像编解码、视频编解码,AIPP可以做归一化配置。

2024-10-17 00:19:43 1074

原创 Atlas800昇腾服务器(型号:3000)—驱动与固件安装(一)

将驱动包和固件包上传到服务器任意目录,如路径:/backup/work/Software_Back。执行以下命令,完成驱动固件安装,软件包默认安装路径为“/usr/local/Ascend”。进入MCU软件包所在路径,执行如下命令启动升级(将NPU ID替换为上述步骤中查询到。进入驱动包和固件包所在目录,执行如下命令,增加驱动和固件包的可执行权限。了初始版本,为了保障所有功能正常使用,请将MCU升级到配套版本。在生效新版本之后,等待30s,查询MCU版本号,确保升级成功。以上,驱动与固件、MCU安装完毕!

2024-10-16 00:37:38 1866

原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列om模型转换测试(三)

安装为ATC转换的必须依赖环境,下面操作在CANN中有在root上装,这里是新用户新环境,需再安装配置一次!YOLOv8s动态宽高640*640耗时测试结果:【存在om尺度检查机制,推理速度更慢】:安装完需source ~/bashrc才能生效!:【检测/分割/关键点om均生成成功】:【检测om生成成功,但出现算子告警】:【检测/分割/关键点om均生成成功】:以下测试模型均为静态onnx!:【检测/分割om均生成成功】:【检测/分割om均生成成功】:【检测om均生成成功】:【检测om均生成成功】

2024-10-16 00:36:23 1418 4

原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【检测】(五)

目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!注意,上述耗时未使用AIPP进行前处理加速,如YOLOv8s加速后前处理+推理大约6-7ms。说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.后处理耗时:除YOLOv10几乎无耗时外,其余1-2ms。开发套件:版本7.0.1【

2024-10-16 00:34:39 2346

原创 【超详细】基于YOLOv11的PCB缺陷检测

印刷电路板(PCB)瑕疵数据集:是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。本文我们选取了其中适用与检测任务的693张图像,随机选择593张图像作为训练集,100张图像作为验证集。

2024-10-07 22:14:03 2642 5

原创 【超详细】基于YOLOv8训练无人机视角Visdrone2019数据集

VisDrone数据集是由天津大学等团队开源的一个大型无人机视角的数据集,官方提供的数据中训练集是6471、验证集是548、测试集1610张。数据集共提供了以下12个类,分别是:‘忽略区域’, ‘pedestrian’, ‘people’, ‘bicycle’, ‘car’, ‘van’,‘truck’, ‘tricycle’, ‘awning-tricycle’, ‘bus’, ‘motor’, ‘others’,其中忽略区域、others是非有效目标区域,本项目中予以忽略;

2024-09-22 20:03:48 12458 36

原创 【变化检测】基于HANet建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-18 00:35:33 1464

原创 【变化检测】基于ChangeStar建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-17 23:31:10 1370

原创 【变化检测】基于STANet建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-09 00:12:10 1567

原创 【变化检测】基于IFN建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-08 23:59:24 1827

原创 【变化检测】基于SNUNeT建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-08 23:53:08 1709 2

原创 【变化检测】基于BiT建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-08 23:42:19 1799

原创 【变化检测】基于ChangeFormer建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-09-08 23:13:30 2061 1

原创 【变化检测】基于Tinycd建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-08-25 19:19:04 1283

原创 【变化检测】基于UNet建筑物(LEVIR-CD)变化检测实战及ONNX推理

LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。

2024-08-24 16:36:17 2337 4

原创 FFmpeg实现文件夹多视频合并

【代码】FFmpeg实现文件夹多视频合并。

2024-08-02 11:26:05 455

原创 【超详细】基于YOLOv8改进1-Drone-YOLO复现

如下图,改进 3(加小目标分支)是提升最显著,为 6.8 个点,无人机小目标较多(P2 是 v8 自。改进 2:三明治结构(作者提出),相比于原先的 concat 操作,多融合了一个上层大尺度特征。(1)性能主要提升来自增加对小目标检测的 P2 层(即增加一个 160*160 的大尺度检测。如下图所示,在 yolov8-n 基础改进上,精度有所提升,参数变化不大,但是推理速度大幅。积核被合并为一个 3×3 卷积层。(2)增加 P2 分支与多支路融合虽然在模型参数方面略微增加,但推理耗时显著增加,不。

2024-05-20 23:47:59 6352 18

原创 【超详细】基于YOLOv8的PCB缺陷检测

印刷电路板(PCB)瑕疵数据集:是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。本文我们选取了其中适用与检测任务的693张图像,随机选择593张图像作为训练集,100张图像作为验证集。

2024-05-16 00:02:05 15098 42

原创 【超详细】跑通YOLOv8之深度学习环境配置3-YOLOv8安装

Pytorch与YOLOv8环境配置

2024-05-14 00:19:00 5734 13

原创 【超详细】跑通YOLOv8之深度学习环境配置2-CUDA安装

CUDA,cudnn安装。

2024-05-12 22:55:47 2420

原创 【超详细】跑通YOLOv8之深度学习环境配置1-Anaconda安装

Anaconda、Vscode、Pycharm、VS2019安装。

2024-05-12 22:27:13 3225 1

原创 基于Copy-paste的图像P图示例

将待P图的所有目标抠取下来(目标可进行一定的数据增强:翻转、旋转、对比度变化等)进行一定比例缩放,粘贴到待P原图设置的区间范围内。

2024-03-14 15:43:59 525

原创 YOLOv8_pose-Openvino和ONNXRuntime推理【CPU】

Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。

2024-03-11 21:23:31 1058

原创 YOLOv8_seg-Openvino和ONNXRuntime推理【CPU】

Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。

2024-03-11 21:19:40 1734

原创 YOLOv7_pose-Openvino和ONNXRuntime推理【CPU】

Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。

2024-03-11 21:12:43 878 1

原创 YOLOv5_seg-Openvino和ONNXRuntime推理【CPU】

Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。

2024-03-11 21:06:48 1328

原创 YOLOv7-Openvino和ONNXRuntime推理【CPU】

Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。

2024-03-11 20:59:36 1435

原创 YOLOv5/6/7-Openvino-ByteTrack【CPU】

Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。

2024-03-05 15:54:29 1540

lap+cython-bbox安装

ByteTrack所需的两个库lap和cython_bbox,安装前需要下载VS2019。

2024-03-05

YOLOv8s+YOLOv9c的onnx文件

具体包括:YOLOv8s.onnx、YOLOv8s-seg.onnx、YOLOv9c.onnx

2024-02-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除