- 博客(65)
- 收藏
- 关注
原创 YOLOv8--绘制中文标签耗时优化
整个绘制中文标签的流程通过初始化字体和颜色、创建并管理字符图像缓存,最终将缓存的字符图像高效地绘制到目标图像上,利用缓存机制减少了重复绘制和字体渲染的开销,提高了绘制效率。
2025-03-30 16:59:49
692
原创 基于YOLOv8的PCB缺陷检测--补充实验
印刷电路板(PCB)瑕疵数据集:是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。本文我们选取了其中适用与检测任务的693张图像,随机选择593张图像作为训练集,100张图像作为验证集。
2025-03-30 14:22:42
1032
原创 Vision Transformer结构与代码详解
在图像分类中,Vision Transformer (ViT)主要包括几个阶段。在图像分类任务中,重点在于提取图像的整体特征以判断类别,编码器足以完成特征提取的任务,所以无需解码器。
2025-03-20 19:51:14
819
2
原创 【超详细】DEIM:最强实时目标检测算法-Visdrone2019无人机数据集实战
VisDrone数据集是由天津大学等团队开源的一个大型无人机视角的数据集,官方提供的数据中训练集是6471、验证集是548、测试集1610张。数据集共提供了以下12个类,分别是:‘忽略区域’, ‘pedestrian’, ‘people’, ‘bicycle’, ‘car’, ‘van’,‘truck’, ‘tricycle’, ‘awning-tricycle’, ‘bus’, ‘motor’, ‘others’,其中忽略区域、others是非有效目标区域,本项目中予以忽略,
2025-01-09 22:58:48
4798
13
原创 【超详细】YOLOv8/11损失函数改进-添加Wise-IoU/MPDIoU/ShapeIoU/Inner-IoU等—Visdrone2019数据集
注意:使用yolo命令训练,需对修改后的整个代码运行pip install -e .2.1 步骤一:新增导入库。
2025-01-03 11:27:59
3365
23
原创 【超详细】基于ultralytics代码训练YOLOv5/8/9/10/11s—Visdrone2019数据集
VisDrone数据集是由天津大学等团队开源的一个大型无人机视角的数据集,官方提供的数据中训练集是6471、验证集是548、测试集1610张。数据集共提供了以下12个类,分别是:‘忽略区域’, ‘pedestrian’, ‘people’, ‘bicycle’, ‘car’, ‘van’,‘truck’, ‘tricycle’, ‘awning-tricycle’, ‘bus’, ‘motor’, ‘others’,其中忽略区域、others是非有效目标区域,本项目中予以忽略;详情见文章1和2。
2024-11-27 23:26:03
1841
7
原创 Atlas800昇腾服务器(型号:3000)—Docker容器部署【图像分类】(十)
(2)导出requirements.txt文件【这里剔除ais_bench相关】(4)构建镜像-名字images_classfication:0001.rc。:鲲鹏 CPU(ARM64)+A300I pro推理卡。(2)启动容器,直接运行脚本:【(1)启动容器,进入终端:【开发套件:版本7.0.1【(5)查看镜像是否存在。
2024-10-28 00:38:59
1425
原创 Atlas800昇腾服务器(型号:3000)—SwinTransformer等NPU推理【图像分类】(九)
mmcls图像分类模型库丰富,涵盖最新的图像分类算法,且安装一个环境,可用一个脚本转onnx模型!(8)Vision Transformer【运行成功】(9)SwinTransformer【运行成功】(1)ShuffleNetv2【运行成功】(3)EfficientNet【运行成功】(4)MobileNetv2【运行成功】(5)MobileNetv3【运行成功】(7)SE-ResNet【运行成功】(1)创建环境和安装pytorch。(2)DenseNet【运行成功】(6)ResNet【运行成功】
2024-10-27 23:39:19
1120
原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【跟踪】(八)
目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。加速后前处理+推理大约10ms左右,bytetrack跟踪耗时2-3ms。:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.有时候,直接pip安装即可,报错的话,去python库官网下载压缩包安装。开发套件:版本7.0.1【
2024-10-19 23:35:10
1403
原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【关键点】(七)
目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。YOLOv8s未使用AIPP进行前处理加速,前处理+推理大约20ms左右;:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.:鲲鹏 CPU(ARM64)+A300I pro推理卡。开发套件:版本7.0.1【
2024-10-19 23:27:13
949
原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【实例分割】(六)
目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。YOLOv8s未使用AIPP进行前处理加速,前处理+推理大约20ms左右;加速后前处理+推理大约10ms左右,画mask耗时较长。:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.开发套件:版本7.0.1【
2024-10-19 23:22:58
857
原创 Atlas800昇腾服务器(型号:3000)—CANN安装(二)
安装后的路径(以root用户默认安装路径为例):“/usr/local/Ascend/ascendtoolkit/latest/opp/built-in/op_impl/ai_core/tbe/kernel”。二进制算子包依赖CANN软件包Toolkit,执行安装时,当前环境需已安装配套版本的。安装完成后,若显示xxx install success,则说明软件安装成功。否则请执行如下安装命令(如果只有部分软件未安装,则如下命令修改为还未安装的。以上,CANN安装完毕,可以进行om模型转换!
2024-10-17 00:20:31
1280
原创 Atlas800昇腾服务器(型号:3000)—AIPP加速前处理(四)
AIPP(Artificial Intelligence Pre-Processing)人工智能预处理,用于在AI Core上完成数据预处理,包括改变图像尺寸、色域转换(转换图像格式)、减均值/乘系数(改变图像像素),数据预处理之后再进行真正的模型推理。该模块功能与DVPP相似,都可以实现媒体数据处理的功能,两者的功能范围有重合,比如改变图像尺寸、转换图像格式,但功能范围也有不同的,比如DVPP可以做图像编解码、视频编解码,AIPP可以做归一化配置。
2024-10-17 00:19:43
1074
原创 Atlas800昇腾服务器(型号:3000)—驱动与固件安装(一)
将驱动包和固件包上传到服务器任意目录,如路径:/backup/work/Software_Back。执行以下命令,完成驱动固件安装,软件包默认安装路径为“/usr/local/Ascend”。进入MCU软件包所在路径,执行如下命令启动升级(将NPU ID替换为上述步骤中查询到。进入驱动包和固件包所在目录,执行如下命令,增加驱动和固件包的可执行权限。了初始版本,为了保障所有功能正常使用,请将MCU升级到配套版本。在生效新版本之后,等待30s,查询MCU版本号,确保升级成功。以上,驱动与固件、MCU安装完毕!
2024-10-16 00:37:38
1866
原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列om模型转换测试(三)
安装为ATC转换的必须依赖环境,下面操作在CANN中有在root上装,这里是新用户新环境,需再安装配置一次!YOLOv8s动态宽高640*640耗时测试结果:【存在om尺度检查机制,推理速度更慢】:安装完需source ~/bashrc才能生效!:【检测/分割/关键点om均生成成功】:【检测om生成成功,但出现算子告警】:【检测/分割/关键点om均生成成功】:以下测试模型均为静态onnx!:【检测/分割om均生成成功】:【检测/分割om均生成成功】:【检测om均生成成功】:【检测om均生成成功】
2024-10-16 00:36:23
1418
4
原创 Atlas800昇腾服务器(型号:3000)—YOLO全系列NPU推理【检测】(五)
目前ais_bench工具只支持单个input的带有动态AIPP配置的模型,只支持静态shape、动态batch、动态宽高三种场景,不支持动态shape场景。:ais_bench调用和使用方式与onnx-runtime几乎一致,因此可参考进行撰写脚本!注意,上述耗时未使用AIPP进行前处理加速,如YOLOv8s加速后前处理+推理大约6-7ms。说明:若为覆盖安装,请增加“–force-reinstall”参数强制安装.后处理耗时:除YOLOv10几乎无耗时外,其余1-2ms。开发套件:版本7.0.1【
2024-10-16 00:34:39
2346
原创 【超详细】基于YOLOv11的PCB缺陷检测
印刷电路板(PCB)瑕疵数据集:是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。本文我们选取了其中适用与检测任务的693张图像,随机选择593张图像作为训练集,100张图像作为验证集。
2024-10-07 22:14:03
2642
5
原创 【超详细】基于YOLOv8训练无人机视角Visdrone2019数据集
VisDrone数据集是由天津大学等团队开源的一个大型无人机视角的数据集,官方提供的数据中训练集是6471、验证集是548、测试集1610张。数据集共提供了以下12个类,分别是:‘忽略区域’, ‘pedestrian’, ‘people’, ‘bicycle’, ‘car’, ‘van’,‘truck’, ‘tricycle’, ‘awning-tricycle’, ‘bus’, ‘motor’, ‘others’,其中忽略区域、others是非有效目标区域,本项目中予以忽略;
2024-09-22 20:03:48
12458
36
原创 【变化检测】基于HANet建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-18 00:35:33
1464
原创 【变化检测】基于ChangeStar建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-17 23:31:10
1370
原创 【变化检测】基于STANet建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-09 00:12:10
1567
原创 【变化检测】基于IFN建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-08 23:59:24
1827
原创 【变化检测】基于SNUNeT建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-08 23:53:08
1709
2
原创 【变化检测】基于BiT建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-08 23:42:19
1799
原创 【变化检测】基于ChangeFormer建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-09-08 23:13:30
2061
1
原创 【变化检测】基于Tinycd建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-08-25 19:19:04
1283
原创 【变化检测】基于UNet建筑物(LEVIR-CD)变化检测实战及ONNX推理
LEVIR-CD 由 637 个超高分辨率(VHR,0.5m/像素)谷歌地球(GE)图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时态图像具有显着的土地利用变化,尤其是建筑增长。LEVIR-CD涵盖别墅住宅、高层公寓、小型车库、大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新的建筑区域的变化)和建筑衰退。这些双时态图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。
2024-08-24 16:36:17
2337
4
原创 【超详细】基于YOLOv8改进1-Drone-YOLO复现
如下图,改进 3(加小目标分支)是提升最显著,为 6.8 个点,无人机小目标较多(P2 是 v8 自。改进 2:三明治结构(作者提出),相比于原先的 concat 操作,多融合了一个上层大尺度特征。(1)性能主要提升来自增加对小目标检测的 P2 层(即增加一个 160*160 的大尺度检测。如下图所示,在 yolov8-n 基础改进上,精度有所提升,参数变化不大,但是推理速度大幅。积核被合并为一个 3×3 卷积层。(2)增加 P2 分支与多支路融合虽然在模型参数方面略微增加,但推理耗时显著增加,不。
2024-05-20 23:47:59
6352
18
原创 【超详细】基于YOLOv8的PCB缺陷检测
印刷电路板(PCB)瑕疵数据集:是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。本文我们选取了其中适用与检测任务的693张图像,随机选择593张图像作为训练集,100张图像作为验证集。
2024-05-16 00:02:05
15098
42
原创 基于Copy-paste的图像P图示例
将待P图的所有目标抠取下来(目标可进行一定的数据增强:翻转、旋转、对比度变化等)进行一定比例缩放,粘贴到待P原图设置的区间范围内。
2024-03-14 15:43:59
525
原创 YOLOv8_pose-Openvino和ONNXRuntime推理【CPU】
Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。
2024-03-11 21:23:31
1058
原创 YOLOv8_seg-Openvino和ONNXRuntime推理【CPU】
Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。
2024-03-11 21:19:40
1734
原创 YOLOv7_pose-Openvino和ONNXRuntime推理【CPU】
Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。
2024-03-11 21:12:43
878
1
原创 YOLOv5_seg-Openvino和ONNXRuntime推理【CPU】
Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。
2024-03-11 21:06:48
1328
原创 YOLOv7-Openvino和ONNXRuntime推理【CPU】
Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。
2024-03-11 20:59:36
1435
原创 YOLOv5/6/7-Openvino-ByteTrack【CPU】
Openvino是由Intel开发的专门用于优化和部署人工智能推理的半开源的工具包,主要用于对深度推理做优化。Openvino内部集成了Opencv、TensorFlow模块,除此之外它还具有强大的Plugin开发框架,允许开发者在Openvino之上对推理过程做优化。Openvino整体框架为:Openvino前端→ Plugin中间层→ Backend后端。
2024-03-05 15:54:29
1540
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人