- 博客(45)
- 资源 (4)
- 收藏
- 关注
原创 python多线程和多进程——使用 concurrent.futures.ProcessPoolExecutor 和 ThreadPoolExecutor
在使用 concurrent.futures.ProcessPoolExecutor 和 ThreadPoolExecutor 时,如果你不指定 max_workers 参数,Python 会根据系统资源和任务类型自动选择一个合理的默认值。对于 ProcessPoolExecutor,如果没有指定 max_workers 参数,默认值是你的机器上的 CPU 核心数。例如,如果你有4核处理器,默认的最大线程数将是 min(32, 4 + 4) = 8。ProcessPoolExecutor 默认值。
2025-03-13 18:27:34
340
原创 python工具——图像数据清洗&图像质量检查
随着目前采集的数据集中的图像越来越多,出现了数据格式十分杂乱、质量不统一、部分图像存在损坏等各种问题。本程序提供各种图像数据清洗和图像质量检查功能,防止模型训练加载数据时出现各种异常。本工具仍在不断改进中……
2025-03-12 19:10:00
170
原创 yolov8乱改版(使用最新源码版本ultralytics-8.3.80——该项目库集成了yolov12)
首先一股脑儿把我之前的GhostNetV3.py、 mobilenetv4.py、 UIB.py几个文件放到/ultralytics-8.3.80/ultralytics/nn/modules路径下。因为之前有个项目把yolov8模型主干替换成了mobilenetv4、GhostNetV3等,现在又新出了yolov12。然后在/ultralytics-8.3.80/ultralytics/nn/modules/这样我之前训练过的被改了主干的模型就又可以用啦。源码版本ultralytics-8.3.80。
2025-02-27 20:17:52
246
原创 如何在Windows下使用Ollama本地部署DeepSeek R1
打开安装程序进行安装,默认是安装到C盘的。你可以通过cmd命令行输入再加上/DIR=来指定安装路径。2、设置安装以及模型路径。
2025-02-19 12:59:22
275
原创 如何使用onnxruntime部署GroundingDINO——记录如何转换onnx模型和推理过程
官方源码与项目1的不同之处在于groundingdino\models\GroundingDINO\groundingdino.py里的forward函数的输入参数不同。如果想导出onnx文件,把项目2的export_onnx.py放在项目1里运行即可生成onnx文件。为了实现将groundingdino模型转换成onnx格式文件,首先确保已经安装好GroundingDINO,请自行参考官方源码进行安装。且项目2提供了C++和Python两个版本的推理程序。
2025-02-07 16:26:19
528
1
原创 Papers with Code——人工智能方向的必备网站
https://paperswithcode.com/sota/object-detection-on-coco
2025-01-24 16:09:37
174
原创 Open-GroundingDino的.Open-GroundingDino/config/cfg_coco.py配置参数注释以及踩坑
官方的GroundingDino只开源了推理的代码,没有给出训练代码,数据集格式也未知,而Open-GroundingDino是作为GroundingDino的第三方实现训练的开源代码,关注GroundingDino的工作是否适合迁移到个人数据集中。当然也可以修改code/Open-GroundingDino/GroundingDINO/groundingdino/models/GroundingDINO/groundingdino.py中的id_map值与自己训练数量一致即可成功执行训练。
2025-01-22 15:14:10
387
原创 简单了解一下各种处理器CPU、GPU、NPU、TPU
•CPU:通用性强,适用于大多数日常计算任务。•GPU:擅长并行处理,特别适合图形渲染和大规模数值计算。•NPU:专门针对神经网络计算进行了优化,适合于AI推理任务,特别是在边缘设备上。•TPU:为张量运算做了专门优化,主要用于云端的大规模机器学习训练和推理。
2024-12-20 09:46:26
726
原创 开放词汇目标检测(Open-Vocabulary Object Detection, OVOD)综述
综上,大多数工作均基于CLIP预训练的图像编码器和文本编码器。GlIP为解决目标检测任务提供了先例,后续很多工作常与目前较为广泛使用的目标检测网络结构相结合,从而构建新的开放词汇目标检测器。如ViLD基于Mask R-CNN、RegionCLIP基于R-CNN、VLDet和BARON基于Faster R-CNN。更具有创新性的工作是Detic,提出了使用图像分类的数据集来对目标检测器的分类头进行训练。
2024-12-20 09:19:14
2420
原创 python工具——图像预处理(resize224*224并进行灰度填充)
将图像统一转换成224*224大小的分类数据图像,并且根据长宽进行灰度(114,114,114)边缘填充,以防止原图发生变形。为了实现这个功能,我们可以使用Python的PIL库(Pillow),它提供了丰富的图像处理功能。下面是一个示例脚本,该脚本会遍历指定目录下的所有图像,将它们统一缩放到224x224像素,同时保持原始图像的比例不变,并在必要时使用灰度(114, 114, 114)边缘填充来避免图像变形。首先,确保你已经安装了Pillow库。
2024-11-08 11:33:22
371
原创 pythons工具——图像的随机增强变换(只是变换了图像,可用于分类训练数据的增强)
从文件夹中随机选择一定数量的图像,然后对每个选定的图像进行一次随机的数据增强变换。
2024-11-08 09:41:00
406
原创 如何用mmclassification训练多标签多分类数据
我这里只是增加了一些度量函数,方便可视化多标签的指标情况,并没有更新其他地方,训练时还是会验证原来的指标,里面调用的Metric类可以参考这篇文章:https://blog.youkuaiyun.com/u013250861/article/details/122727704。训练数据标签文件格式如下,每行的空格前面是路径(图像文件所在的绝对路径),后面是标签名,因为特殊要求这里我的每张图像都记录了三个标签每个标签用“,”分开(具体看自己的需求),我的训练标签数量是17个。
2024-10-23 18:03:13
757
原创 yolov8图像分类推理程序的预处理步骤抽取出来-纯代码-干货分享
•将图像从 (H, W, C) 转换为 (C, H, W) 格式。官网文档:https://docs.ultralytics.com/zh/models/yolov8/•new_shape 是目标尺寸,color 是填充颜色,默认为灰色 (114, 114, 114)。•将图像从 BGR 转换为 RGB 格式。•将像素值归一化到 [0, 1] 范围。•读取图像并调用 letterbox_image 函数进行调整大小和填充。•该函数用于调整图像大小并保持宽高比,同时在图像周围添加黑色填充。
2024-10-15 15:59:06
748
原创 使用from torchinfo import summary 查看网络结构
分享一个好用的查看网络结构的工具,从ghostnet的源码中看见的,其他的网络结构换个函数就行。用到你的程序里面试试吧!
2024-10-14 15:28:53
248
原创 【YOLOv8改进】 YOLOv8 更换骨干网络之GhostNetV3步骤详解
这里yolov8源码版本是 ultralytics-8.2.54GhostNetV3 源码下载 https://codeload.github.com/huawei-noah/Efficient-AI-Backbones将ghostnetv3.py文件复制一份到源码./ultralytics-8.2.54/ultralytics/nn/modules路径下我根据mobilenetv4的教程,修改了ghostnetv3.py文件的以下部分:class GhostNet(nn.Module):
2024-10-12 15:36:10
2140
9
原创 Agent:原理与快速构建 | 人工智能 | Langchain | Python ——学习笔记
视频链接:https://www.bilibili.com/video/BV1Hz421b7ag/?
2024-09-18 10:45:18
488
原创 显示中文字体问题解决:ImportError: The _imagingft C module is not installed
字体文件:https://download.youkuaiyun.com/download/yangsn0719/89689325。然后在用下面这句代替原来的用cv2.putText写入文本的语句就可以啦。
2024-08-29 09:33:42
410
原创 如何解决libpng warning: iCCP: known incorrect sRGB profile、OSError: cannot write mode RGBA as JPEG
【代码】如何解决libpng warning: iCCP: known incorrect sRGB profile、OSError: cannot write mode RGBA as JPEG。
2024-08-26 10:13:13
1196
原创 使用SAM分割一切模型对已有检测框的数据生成json分割标注-纯代码干货分享
【代码】借助sam分割模型对已经有标注框的数据生成json格式的多边形分割标注-纯代码干货分享。
2024-08-21 17:33:33
348
7
原创 借助Qwen-VL-Chat大模型生成xml标注-纯代码-干货分享
本工具参考:https://github.com/QwenLM/Qwen-VL/blob/master/TUTORIAL.md。本文默认使用以下代码前已准备好Qwen-VL的运行环境,且已下载了Qwen-VL-Chat模型文件。
2024-08-21 17:08:08
464
原创 一个人完成数据集收集和初步处理-纯代码实用干货
第三步:下载完成,重命名也完成之后,最好做一遍数据去重,不然重复图像很多的话,在后续标注的时候会产生更大的工作量。第一步:你想从下载一些图像,作为业务数据集的初始准备,使用如下代码(我推荐使用百度,重复数量更少)
2024-08-21 08:56:26
196
2
原创 python基础编程提升效率篇(一)——判断文件是否存在
经过测试发现,如果使用我习惯的判断方式,效率会比用os.path.exists(path) 正常判断文件是否存在慢好几倍不止。这里的主要原因是我习惯使用的方式,每次都要用os.listdir()读取一遍文件夹中的文件名列表,而且还要判断一个文件名是否在列表里,这耗费了大量时间。这也可能只是本人的代码习惯,不知道有没有人也会这样。唉,以后一定不能再这样用了,而且在以后写循环的时候,也要多注意一下类似的问题,吃一堑长一智。
2024-08-07 12:54:56
220
原创 yolov8如何设置显卡并批量推理_调用API推理示例
你可以在官网找到这样一个推理示例,但是这里没有设置显卡。这里提供一个用于可以设置显卡进行批量推理的示例。
2024-07-17 14:56:48
503
原创 yolov8训练数据警告检查
具体的源码出处以及警告原因可以在你自己的源码路径下./ultralytics/ultralytics/data/utils.py文件的verify_image、verify_image_label函数里查询。这里我把警告里出现两个冒号的都删了后面的一个,因为我根据冒号进行了分离字符串,我这里分类进行了保存,便于后面根据不同的警告原因进行不同检查和处理。首先,你需要将这些警告内容自行复制到一个新建的空白txt里,如下图。在yoloV8训练过程中,你应该也遇到过如图上的数据问题。后面自行检查这些数据即可。
2024-07-17 11:09:05
2368
2
原创 pythons工具——裁剪labelme的json不规则多边形标签保存成矩形图像
使用以下程序,裁剪labelme的json不规则多边形标签保存成矩形图像。使用以下程序,裁剪labelme的json不规则多边形标签保存成矩形图像。
2024-06-26 13:48:05
421
原创 python图像裁剪工具——根据labelme、lableimg标注文件裁剪目标图像
根据标注文件(格式支持json、xml)裁剪需要的目标类型图像, 用于进行分类训练。
2023-11-28 17:49:39
557
3
原创 pytorch模型的多batch推理
pytorch模型的多batch推理,这里用的是一个多标签分类模型,所以最后用的不是softmax而是sigmod。
2023-11-23 14:13:36
836
原创 YOLOv5 小目标检测数据预处理——批量数据裁剪并切分json标注文件
【代码】YOLOv5 小目标检测数据预处理——批量数据裁剪并切分json标注文件。
2023-04-06 13:51:29
578
原创 人脸识别insightFace-模型训练config.py文件注释详解
# !/usr/bin/python# -*- encoding: utf-8 -*-import numpy as npimport osfrom easydict import EasyDict as edict# config配置是最基本的配置,如果后面出现相同的,则被覆盖config = edict()config.bn_mom = 0.9 # 反向传播的momentumconfig.workspace = 256
2020-12-22 16:26:44
1056
4
原创 insightFace跳坑实录(2020.11.18)
项目场景:insigthface这个项目真的有点费劲,研究了两三天,到处跳坑,总算是能够在公司设备上运行起来了,这里暂时先记录下自己这两天遇到的坑。先说下我这边的设备配置:显卡型号:GeForce RTX 2080 SUPER发行版本:CentOS Linux 7 (Core)最开始的CUDA版本:9.0(跳坑的一切罪恶之源)问题描述:在以上配置之下,当我按照官网源码步骤想测试一下的时候,我输入以下运行命令python recognition/ArcFace/verification.py
2020-11-18 14:06:08
226
1
原创 Pytorch_Retinaface源码测试记录(2020.11.06)
Pytorch_Retinaface在测试的时候遇到了点问题,浪费了半天时间在这个问题的解决上面,刚看到前辈的文章终于解决了。参考内容:1、 https://blog.youkuaiyun.com/qq_35975447/article/details/1094479292、官方说明:https://github.com/biubug6/Pytorch_Retinaface添加链接描述测试过程遇到的问题及其解决:首先把需要用到的数据集下载下来,环境安装我用的是现成的一个pytorch环境,这些都没啥问题,官方
2020-11-06 10:55:02
207
1
原创 人脸识别(Facenet)源码测试(20.11.4)
由于Facenet官方源码时间比较久了,python版本也还是3.5版本,完全按照Validate on LFW · davidsandberg/facenet Wiki的官方说明出现了一些版本上的问题,因此在这里做个记录。参考网址:1、 github源码网站Validate on LFW · davidsandberg/facenet Wiki2、 csdn博客:从facenet源码中测试人脸比较的准确率3、 博客园:facenet 进行人脸识别测试4、 问题处理(百度/必应等直接搜索)遇到的
2020-11-04 14:49:42
294
在获取一批图像数据后,需要对这些图像进行清理和筛选 本脚本旨在自动识别并筛选出不符合要求的图像文件,例如损坏的或格式不正确的图片
2025-03-21
Transformer课程笔记
2024-09-19
图像异常检测算法调研-20230607
2024-06-12
人脸识别之insightface使用自己的数据集制作训练文件以及详细说明
2020-12-22
人脸识别之insightface使用自己的数据集制作训练文件以及详细说明
2020-12-22
20.09.01brhy面试题目.pdf
2020-09-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人