该醒醒了~-优快云博客

原创训练paddleocr数据集在原有的数据集中加入新标注的数据一起训练（建议收藏）

最后打开PPOCRLabel.py文件运行打开标注工具选择你新旧数据集合在一起的数据集。侧面这里不带勾，这个没关系，这是以为你路径不正确，直接往下走就行。如果你在上方文章的第三步结束了，将会生成三个文件和一个文件夹如下。接着你需要将你新标注的图片也要加入到你原来的数据集中，其中crop_img中的图片用来训练文字识别模型，fileState记录图片的打标完成与否，rec_gt为训练文字识别模型的标签。Label为训练文字检测模型的标签，最后的最后就可以训练了。

2025-02-26 10:22:20 249

原创 Yolov8训练方式以及C#中读取yolov8+onnx模型进行目标检测.NET 6.0

Yolov8训练方式以及C#中读取yolov8+onnx模型进行目标检测.NET 6.0

2025-01-07 11:01:41 813

原创 PyCharm嵌入Qt5 Designer 外部文件做ui界面（建议收藏）

牢骚：之前因为配置的时候没在意，今天py突然出问题，打不开了，只能回溯了，也就是类似重新安装，结果什么都没有了，只能重新配置，网上的一堆教程，一搜搜一堆，堆堆不一样，反正我是没有一个能用的网上说配置什么 pyuic5 pyrcc什么的，反正这些在我这边没啥用，要么报错要么没反应，所以写个文章保留一下。废话不多说咱们开始！！！！

2024-12-31 12:22:54 461

原创 Yolo算法中特征相似导致误报问题

训练目标检测时会碰到一种很奇怪的问题，明明两种目标有很大的差别但是却会被误识别，从而产生大量的误报，这种不利于生产。其实解决办法也很简单就是一起参与训练从而避免这种问题。训练教程可以看我的系列专栏，里面有你想要的下面开始我们的教程。

2024-12-24 15:15:25 633

原创最新深度学习YoloV11训练，转化，推理，C#部署

注意本文主要是介绍YoloV11的相关操作以及主要应用，想要了解yolov11的人可以看网上其他人的介绍引。

2024-12-20 13:51:07 2634 5

原创 PaddlePaddle推理模型利用Paddle2ONNX转换成onnx模型

c后面是你配置的det 的yaml文件 -o Global.pretrained_model=后面是你训练后的模型 latest。lobal.save_inference_dir=保存转换后的推理模型位置。params_filename 是结尾是 .pdiparams文件。model_filename 是结尾是 .pdmodel文件。save_file 保存转换后的onnx模型。model_dir 是你训练模型的文件夹。如果看不明白，下方是我的转换命令。rec的转换和上方的det一样。

2024-12-17 13:07:29 993

原创 halcon深度学习目标检测案例

目标检测是需要标注训练的所以，按照如下的流程即可。这是一些参数上方那个hdl是模型保存的地方。数据集是你在深度学习训练工具上面导出的文件。当出现这个字样就证明训练完成。配置好之后就可以点击。

2024-12-05 11:10:57 485

原创 C#实时监控指定文件夹中的动态，并将文件夹中生成的新图片显示在界面上（相机采图，并且从本地拿图）

结果展示。

2024-12-05 10:39:24 656

原创 C#的.net60版本的.NET报异常System.ArgumentException:“Parameter is not valid.”参数异常

有些方式 .net 和 .net formeworker 表达方式不同需要注意。报错信息如下这种情况是因为你用.net formeworker版本的表达方式。不能用Image类型需要转成Bitmap 格式。这是因为你图片读取的方式出错。修改后就可以读取了！

2024-11-28 15:25:31 310

原创使用Setup Factory将C#的程序打包成安装包

14、点击输入掩码 ####-####-####-#### 16个个数可以自定义。7、这里一定要注意，如果你的C#程序可以在你电脑上运行，那么你可以不需要勾选。3、如下文件夹路径就是你C#中exe的那个文件夹，我的是bin/debug。序列号就是第17步的那个生成的序列号，输入任意一个就行。2、设置如下信息，也可以不设置，最好填非空的、15、回到主页，点击安全，再双击序列号如下。9、点击过滤器再双击你的exe 进入。5、主题可以如下的下拉列表中设置。11、按照如下的流程添加一个页面。

2024-11-26 17:42:14 932

原创 Photoshop制作图标（只有图标没有背景）

这里以C#的exe为例下面里面有白色的是因为之前我没有把中间那个白色的给去掉，按照上述流程就可以制作自己的图标了，想要什么图标可以直接去网上搜。但是图标是需要.ioc文件的可以再如下链接中转化。结束有不解的问题可以再评论区里回复。

2024-11-05 20:06:00 620

原创 halcon帮助文件不能再xxx中找到，问题解决

如果你用户变量里没有这四个 halcon 路径那么你就手动添加。HALCONROOT 这个路径是你halcon 的安装路径。

2024-10-14 10:40:57 626

原创 YoloV10 训练自己的数据集（推理，转化，C#部署）

yolov10和yolov8的文件结构差不多所以如果你训练过其他的yolov5以上的yolo，你可以直接拷贝环境进行使用，当然你如果想配置gpu。然后再设置各项参数你可以再其中自己定义一个文件里面写上你需要的类比如置信度，类别以及类别数量等等。为后续的dll生成做准备。下载anaconda 并安装在网上随意下载一个2022版本的就行。创建一个名为yolo的cs文件用于将yolov10模型结构做引用。下方网站中下载你需要的版本下载时要注意对应关系，我们需要设定yolov10的模型结构。

2024-09-14 10:43:42 4255

原创 HALCON 深度学习异常检测实例

首先你需要下载软件，halcon 20+的版本和 Deep Learning Tool 工具。

2024-08-28 16:20:53 868 2

原创 halcon 深度学习软件工具安装以及用法

安装halcon 20版本以上得以为这个版本以上得有异常检测，分割，分类，目标检测，都有。

2024-08-26 14:58:44 1558 3

原创 halcon实现图片裁切，用roi画区域将区域内的目标裁切下来图片尺寸保持不变加代码

拖一张图片到halcon软件中，或者直接读取。画好区域后，鼠标右击一下你画的roi区域如上。然后再利用代码将你画出的区域保存下来。然后点击上方区域代码生成。以上点击你要画的区域形状。

2024-08-22 10:45:26 806

原创 PPOCR训练后acc为0解决方法

将如下的train和eval部分的batch_size改小点，例如8。如下是rec训练模型 acc为0 det也是如此。首先你需要先配置PPOCR源码和环境，可以按照如下流程。模型文件中会生成best文件，这种就属于没问题的。如下没有名为best的模型文件。然后再次运行就有了acc了。

2024-07-16 13:41:49 908 5

原创 YOLOv8-OBB训练时报错：ValueError: not enough values to unpack (expected 3, got 0)

X-AnyLabeling标注软件安装及使用dota数据集，voc数据集，coco数据集。以及报错No module named‘anylabeling‘的解决_x-anylabeling标注的多变形标签yolov8为什么使用不了-优快云博客。如果你是用X-anylabeling 标注的生成的dota数据集的话，那么是因为你配置的问题。yolov8-obb训练自己的数据集（标注，训练，推理，转化模型）-优快云博客。obb是一种旋转框的检测这种报错是因为数据集的问题。请严格按照如下流程进行数据集的配置。

2024-07-15 11:50:43 730

原创 yolov8-obb训练自己的数据集（标注，训练，推理，转化模型 + C#模型部署）

直接去下载官方的yolov8源码就行，那里面集成了 obb。

2024-07-13 15:58:52 8911 39

原创 X-AnyLabeling标注软件安装及使用dota数据集，voc数据集，coco数据集。以及报错No module named‘anylabeling‘的解决

环境的话如果你是标注yolo数据集，那么你直接可以用yolo的环境，或者直接。旋转标注标注后点击标注的框用 z,x,c,v 来更改角度。这个标注工具有很多功能，以上是主要功能，其他的功能，自己研究一会就都明白了。标注后点击导出选择你需要的模型进行导出就好了。注意你下载后的文件夹名种不能有任何符号，例如。再运行报错再进入进行修改，直到不报这种错。点击进入报错位置继续修改点入报错位置。然后修改完继续右键运行报错。

2024-07-11 13:44:51 1227 1

原创 python-opencv多态模板匹配简单代码实现

原图模板图结果图。这就表明，你如果用模板匹配做识别，不但要定位到目标，还要确保，定位到的位置和模板匹配图尺寸相同。在我实验过程中发现，这种模板匹配如果不做任何处理只对原有图像进行匹配的话，好像效果很瓜。貌似是模板是1 那就只能检测出正常形态下的1，变大或者是 l 都不一定检测到，如果你的预测图是这样的那么你模板图就要和它一样。简单匹配实现代码如下。

2024-07-04 14:28:41 505

原创 Yolov10训练，转化onnx，推理

最小模型是N 最大模型是X 区别就是，越小的就越快，精度相对的会低一点点，越大的就越慢，精度会高一点，建议用S和M的比较中和，设备不行的就用N。你可以在目录中创建三个文件，detect.py,export.py,train.py文件像这样。然后再目录中创建一个data文件夹，再其中创建一个data.yaml的文件。我这是配置的cuda 调用GPU的版本，下载可以再我的博文里下载。打开刚刚创建的detect.py文件添加代码就可以推理了。打开刚刚创建的export.py 文件添加代码。

2024-07-03 19:02:02 2697

原创 yolov10报错requests.exceptions.comnectionEprar: HITpscoanectionpol(hast=“‘api.github.com‘, port=43):

运行yolov10推理图片样本时报错。

2024-07-03 14:03:39 499

原创 yolov5实例分割跑通以及C#读取yolov5_Seg实例分割转换onnx进行检测部署

链接：https://pan.baidu.com/s/1m-3lFWRHwg5t8MmIOKm4FA。链接：https://pan.baidu.com/s/1mwl2poblQUuFEwSpE2dvqA。一、首先需要训练yolov5_seg的模型，可以去网上学习，或者你直接用我的，classes_count_1 类别的个数你有多少类别你就设置几个。NMS_Threshold 非极大值抑制的值，确定框的数量。或者你直接下载我的环境，都喂你嘴里，就看你吃不吃了，yolov5_seg算法的环境。

2024-07-02 11:49:26 958

原创 PaddleOCR训练自己的数据集（中英文）（全套）和C#部署（半套）

2024-06-25 14:23:15 2407 1

原创 PPOCR训练报错ModuleNotFoundError: No module named ‘ppocr.modeling‘

我的解决办法是把，你下载的飞桨的PPocr源码版本换成最新版的。然后配置好环境和yaml文件后就可以愉快的训练了。我报错的版本是r2.6 换成main就没问题了。

2024-06-19 16:37:05 870

原创 (解决)C++libtorch调用torch模型（torchscript）xx处(位于 xx.exe 中)有未经处理的异常: Microsoft C++ 异常: c10::Error位于内存位置 xx

转化后是这样的和yolov5 5.0不同，但是都可以读取。这两个异常在我这里可以归为一类。

2024-06-13 10:50:59 415

原创（解决）C#报错System.Exception:“无法从带有索引像素格式的图像创建 Graphics 对象。”

我这边原因是因为图片的深度位是8位的，而实际读取的确实深度位24位的。这个问题是因为C#内部图像读取的限制和规则问题。所以需要把图片位改为24位。

2024-05-13 16:05:39 548 1

原创 System.OutOfMemoryException: 内存不足解决

这是因为你读入的数据太大太大，导致平台内存不够，再大的内存也会报错，但是net.core不会出现这种问题，但是net framework 有这个问题，ok解决。电脑系统和你程序系统不匹配一致就行了。就两张图，看什么改啊。

2024-04-25 14:27:38 905 1

原创 yolov5-7.0+C#导入onnx模型C#部署并将net.core程序用net.framework实现+源码

一、yolov5是深度学习的一个目标检测算法，具有很强的实现能力。本篇文章主要是讲如何用C#读取yolov5模型做目标检测二、首先C#+yolov5肯定是要训练模型 1.选用yolov5-7.0 2.有几个包需要注意除此之外的其他包都可pip opencv-4.7.0 torch-1.13.0 torchaudio-0.13.0 torchvision-0.14.0 cu

2024-04-25 12:55:24 1732 12

原创 yolov5-7.0实现训练推理以及C#部署onnx

本文是讲yolov5-7.0的算法实战实验官网下载新的 YOLOv5版本 v7.0实例分段模型是世界上最快、最准确的模型，超过了所有当前的SOTA 基准测试。

2024-04-25 11:39:59 1427

原创 C#调用yolov5模型转化onnx模型实现C#模型部署

2024-04-25 10:51:14 5550 14

原创 cuda和cudnn各个版本的Pytorch下载网页版，onnx，ncnn，pt模型转化工具

CUDA Toolkit Archive | NVIDIA Developerhttps://download.pytorch.org/whl/torch_stable.html Chatgpt在线网页版-永久免费使用！一键转换 Caffe, ONNX, TensorFlow 到 NCNN, MNN, Tengine

2023-04-24 11:21:40 3054

原创 pt和onnx和ncnn之间的转换以及避坑

这个转化比较简单python里就可以这个文件yolov5-5.0>models>export.py下面那个根据自己的环境修改，环境是你yolov5运行的环境cpu就填cpu gpu就填 0修改好后运行有可能需要下载onnx包直接pip。

2023-04-17 09:29:39 8868 2

原创根据面阵相机拍摄的速度和传送带运动的速度将拍摄的实物图片的每一帧进行无缝拼接使其成为一张完整的图片的全部流程以及c++代码

在opencv中有类似的拼接方法，例如全景拼接因为全景拼接基于特征点进行匹配的一种拼接方法，如果简单拼接可用此方法，下面我们来看一段简单的代码程序。此程序目前处于研究阶段，后续更新敬请期待，如果为码友有很好的建议欢迎评论区讨论，都是中国人不要见外，共同进步，赚钱！

2023-04-13 20:32:24 554 3

原创 opencv2.4.9 实现摄像头实时拍摄并保存每一帧图片到指定文件夹

此脚本为opencv2.4.9环境下的，其他版本有可能报错。打开摄像头并显示每一帧但不保存。提取关键帧的简单程序。

2023-04-13 19:27:50 1037

原创 Python将所有图片的中文名改为指定名

new_name_ 是你想改的图片名修改后图片名是new_name_.95884.54646.bmp 后面的数字是随机生成的。中间的点是可用性符号，如果你要做yolo数据集且对命名无要求此名完全可以读取。注意这个脚本修改的是文件夹下所有的图片名，其中。

2023-04-10 19:13:31 258

原创 YOLOV5训练时P、R、mAP等值均为0的问题

需要注意的是，P、R、mAP等指标为0并不一定意味着模型无效。训练时间太短：如果训练时间太短，则模型可能没有足够的时间来收敛到最佳状态。模型过于简单：如果模型过于简单，则很难从样本中学习到有效的特征。考虑增加网络的深度和宽度，或使用更复杂的网络结构。预处理步骤出现问题：确保数据预处理流程正确，例如确保使用正确的缩放方式和颜色空间转换，以及应用正确的数据增强策略。学习率过高或过低：首先尝试将学习率降低到一个更合适的水平，并考虑使用学习率调度程序来优化训练过程。

2023-04-06 19:07:22 10488 13

原创 winform基础操作C#获取并处理图片像素

介绍基于.NET程序库中System.Drawing中的Bitmap，进行图像的像素级处理。简述基于Windows Form桌面应用程序框架，小程序的输入输出实现。（使用pictureBox控件）Visual Studio 2015 (08/10/12/13/17均可用）默认基于.NET 2.0(高版本也可用)任意图片文件。

2023-03-31 10:18:38 3543

原创 HDDevelop13 编写 halcon 库实现圆心的轮廓检测

【代码】HDDevelop13 编写 halcon 库实现圆心的轮廓检测。

2023-03-30 16:40:06 512

labelme中文标注工具双击exe即可直接运行

2025-04-03

Unet语义分割训练源码包含（数据集标注后的转化脚本和预训练模型）

语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支。与分类任务不同，语义分割需要判断图像每个像素点的类别，进行精确分割。语义分割目前在自动驾驶、自动抠图、医疗影像等领域有着比较广泛的应用

2025-04-03

XAnyLabelimg-obb标注软件打开exe即可可自动标注

软件使用https://blog.youkuaiyun.com/qq_65356682/article/details/140347779?spm=1001.2014.3001.5502

2025-03-08

Labelimg-1.8.6最新版本exe，内有其源码，以及自动标注的源码文件

labelimg1.8.6版本的功能相比老版本的程序工具，更方便，直接按ctrl+V 即可复制上一张的全部目标框，但是位置是上一张的位置，相同的两张样本可以如此，但是这是在相邻的两个或多张可用次功能。

2025-03-08

YoloV10+C#部署（.NET Framework）内有dll生成程序

训练使用可在这里查看 https://blog.youkuaiyun.com/qq_65356682/article/details/140159671?spm=1001.2014.3001.5502 YOLOv10引入了无NMS的一致双分配训练策略，结合了一对多和一对一分配策略的优势。在训练过程中，模型利用一对多分配的丰富监督信号，而在推理过程中则使用一对一分配的预测结果，从而实现无NMS的高效推理。一致匹配度量：为确保两个分支的预测感知匹配，YOLOv10提出了一致匹配度量，通过调整匹配度量参数，使得一对一和一对多分配的监督信号一致，减少了训练期间的监督差距，提升了模型的预测质量。效率-精度驱动的模型设计： YOLOv10在模型设计上采用了多种技术来降低计算成本，同时保持较高的检测性能。这包括轻量化分类头、空间-通道解耦下采样、基于秩的块设计、大核卷积和部分自注意力模块等。

2025-03-08

paddleocr预训练模型

源码与训练教程如下 https://blog.youkuaiyun.com/qq_65356682/article/details/139954234?spm=1001.2014.3001.5502

2025-02-26

PaddleOCR-main（可训练可标注一体，内置推理脚本）（这个版本可正常训练，亲测可用）

训练字符识别源码，训练教程与预训练模型如下 https://blog.youkuaiyun.com/qq_65356682/article/details/139954234?spm=1001.2014.3001.5502

2025-02-26

C# 读取 Yolov11 转换的onnx模型进行模型推理

讲解训练文章 https://blog.youkuaiyun.com/qq_65356682/article/details/144607030#comments_36168846

2025-02-06

C#+Yolov8+onnx net6.0目标检测推理

此程序为Yolov8的目标检测C#推理代码， Yolov8创新点 Yolov8主要借鉴了Yolov5、Yolov6、YoloX等模型的设计优点，其本身创新点不多，偏重在工程实践上，具体创新如下：提供了一个全新的SOTA模型（包括P5 640和P6 1280分辨率的目标检测网络和基于YOLACT的实例分割模型）。并且，基于缩放系数提供了N/S/M/L/X不同尺度的模型，以满足不同部署平台和应用场景的需求。 Backbone：同样借鉴了CSP模块思想，不过将Yolov5中的C3模块替换成了C2f模块，实现了进一步轻量化，同时沿用Yolov5中的SPPF模块，并对不同尺度的模型进行精心微调，不再是无脑式一套参数用于所有模型，大幅提升了模型性能。 Neck：继续使用PAN的思想，但是通过对比YOLOv5与YOLOv8的结构图可以看到，YOLOv8移除了1*1降采样层。

2025-01-06

从本地实时拿图显示到窗口中并接收tcp发送的信号转为字符串显示在窗体中实现检测可视化

程序解释： https://blog.youkuaiyun.com/qq_65356682/article/details/144258045?spm=1001.2014.3001.5502 此程序主要是用于相机无法利用sdk或者其他方式取图，只能将采集到的样本保存到本地文件夹中，从本地文件夹实时取图结合tcp发送的字符串达到效果可视化的需求！！

2025-01-03

C#读取yolov5模型onnx进行模型推理.net461版本附赠(.net461和.net6.0之间的转换)

https://blog.youkuaiyun.com/qq_65356682/article/details/138184895?spm=1001.2014.3001.5502 YOLOV4出现之后不久，YOLOv5横空出世。YOLOv5在YOLOv4算法的基础上做了进一步的改进，检测性能得到进一步的提升。虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析，但是YOLOv5在COCO数据集上面的测试效果还是挺不错的。大家对YOLOv5算法的创新性半信半疑，有的人对其持肯定态度，有的人对其持否定态度。在我看来，YOLOv5检测算法中还是存在很多可以学习的地方，虽然这些改进思路看来比较简单或者创新点不足，但是它们确定可以提升检测算法的性能。其实工业界往往更喜欢使用这些方法，而不是利用一个超级复杂的算法来获得较高的检测精度。本文将对YOLOv5检测算法中提出的改进思路进行详细的解说，大家可以尝试者将这些改进思路应用到其它的目标检测算法中。

2025-01-03

pycharm社区版本免费可用

2024-12-31

Anaconda3-2021.11-Windows-x86-64安装包

2024-12-20

Yolov11最新的源码文件包含（训练，转化，推理）脚本文件

ultralvtics发布了最新的作品YOLOv11，这一次YOLOv11的变化相对于ultralvtics公司的上一代作品YOLOv8变化不是很大的 (YOLOv9YOLOv10均不是uitralyics公司作品)，其中改变的位置涉及到C21变为C3K2，在SPPF后面加了一层类似于注意力机制的C2PSA，还有一个变化大家从yaml文件是看不出来的就是它的检测头内部替换了两个DWConv，以及模型的深度和宽度参数进行了大幅度调整，但是在损失函数方面就没有变化还是采用的CIoU作为边界框回归损失，下面带大家深入理解一下ultralytics最新作品YOLOv11的创新点。

2024-12-20

yolov8obb训练源码

YOLOv8 是YOLO 系列实时物体检测器的最新迭代产品，在精度和速度方面都具有尖端性能。在之前YOLO 版本的基础上，YOLOv8 引入了新的功能和优化，使其成为广泛应用中各种物体检测任务的理想选择。主要功能先进的骨干和颈部架构： YOLOv8 采用了最先进的骨干和颈部架构，从而提高了特征提取和物体检测性能。无锚分裂Ultralytics 头： YOLOv8 采用无锚分裂Ultralytics 头，与基于锚的方法相比，它有助于提高检测过程的准确性和效率。优化精度与速度之间的权衡： YOLOv8 专注于保持精度与速度之间的最佳平衡，适用于各种应用领域的实时目标检测任务。各种预训练模型： YOLOv8 提供一系列预训练模型，以满足各种任务和性能要求，从而更容易为您的特定用例找到合适的模型。支持的任务和模式 YOLOv8 系列提供多种模型，每种模型都专门用于计算机视觉中的特定任务。这些模型旨在满足从物体检测到实例分割、姿态/关键点检测、定向物体检测和分类等更复杂任务的各种要求。 YOLOv8 系列的每个变体都针对各自的任务进行了优化，以确保高性能和高精确度。

2024-12-12

C#实现PaddleSharp

2024-12-09

visionpro案例（零件尺寸测量与显示，硬币统计，骰子点数统计）等

内有如下案例：零件尺寸测量与显示硬币统计骰子点数统计零件孔位数量统计零件瑕疵检测啤酒盖瑕疵检测书签类型检测手机电池正反面识别车牌识别零件孔位矩形标注多目标陶瓷釉面瑕疵检测标注地面裂痕检测标注杂志页排序药物胶囊瑕疵检测

2024-12-09

3D目标检测案例以及源码

最近基于时态LiDAR的3D目标探测器基于两阶段提案的方法实现了有前途的性能。它们从第一阶段的密集探测器生成3D盒状晶体日期，然后采用不同的时间聚合方法。然而，这些方法需要每帧对象或整个点云，与存储体的利用率有关的挑战。此外，点云和轨迹特征完全基于关联来组合，这可能忽略了它们之间的有效相互作用。在这篇论文中，我们提出了一种具有长短期记忆的点轨迹变换器，用于高效的时态三维物体检测。为此，我们只利用当前帧对象的点云及其历史轨迹作为输入，以尽量减少存储体的存储需求。此外，我们引入了对轨迹特征进行编码的模块，重点关注长期、短期和未来感知视角，然后将它们与点云特征有效地聚合。我们进行广泛的前在大规模Waymo数据集上进行实验以演示我们的方法在与最先进技术相比表现良好。

2024-12-09

语义分割论文以及源码文件

在这篇论文中，我们首先评估和利用各种Vi-领域背景下的组织基础模型(VFMS)广义语义分割(DGSS)。为了利用更强大的预训练模型和较少的可训练参数以获得更好的泛化能力，我们引入了一种稳健的微调方法，即“Rein”，以参数高效地利用VFMS进行DGSS。基于一组可训练的标记，每个标记都与不同的实例相关联，“Rein精确地细化并从前一层传递特征图到主干中的下一层。该过程为同一图像中的不同类别产生不同的细化。由于可训练的参数较少，Rein 能够高效地为DGSS 任务微调 VFM，出人意料地超越了全参数微调。在各种设置下的广泛实验表明，Rein显著优于最先进的方法。值得注意的是，仅增加 1%的可训练参数

2024-12-09

图像生成(Image Generation)

文本到图像扩散模型可以生成高质量的图像，但无法控制图像中的单个实例。我们引入了nstanceDiffusion，它为文本到图像扩散模型添加了精确的实例级控制。InstanceDiffusion支持每个实例的自由语言条件，并允许灵活指定实例位置例如简单的单个点、涂鸦、边界框或复杂的实例分割掩码及其组合。我们提出了三个主要变化，以实现对文本到图像模型的精确实例级控制。我们的UniFusion块为文本到图像模型提供了实例级条件ScaleU块提高了图像保真度，我们的多实例采样器提高了多个实例的生成。InstanceDiffusion在每种情况下都显著超越了专业的最先进模型。

2024-12-09

目标检测(Object Detection)

端到端基于Transformer的检测器DETRS)取得了显著的性能。然而，DETRS的高计算成本限制了它们的实际应用，并阻止它们充分利用无后处理的优势，如非最大值抑制(NMS)。本文首先分析了NMS对现有实时目标检测器的准确性和速度的负面影响，并建立了端到端速度基准。为了解决上述问题，我们提出了一种实时DEtectionTRansformer(RT-DETR)，这是我们目前所知的第一款实时端到端目标检测器。具体来说，我们设计了一种高效的混合编码器，通过解耦内尺度交互和跨尺度融合，高效地处理多尺度特征，并提出loU-aware查询选择，通过向解码器提供更高质量的初始对象查询来进一步提高性能。此外，我们提出的检测器支持在不进行重新训练的情况下使用不同的解码器层灵活调整推理速度，这便于在各种实时场景中实际应用。我们的RT-DETR-L在COCOval2017上达到53.0%的AP，在T4GPU上达到114FPS，而RT-DETR-X达到54.8%的AP和74FPS，在速度和准确性上都优于同规模最先进的YOLO检测器。此外，我们的RT-DETR-R50达到53.1%的AP和108 FPS

2024-12-09

多模态大语言模型(MLLM)

多模态大语言模型(MLLMS)具有在各种领域展示了令人印象深刻的教学能力开放式任务。然而，以前的方法主要用于.关于增强多模态能力的讨论。在这项工作中我们介绍了一种多功能的多模态大语言模型,mPLUG-0wi2有效地利用模态协作来提高文本和多模态任务的表现。mPLUG-Owi2采用模块化网络设计，语言解码器作为管理不同模态的通用接口。具体来说，mPLUG-Owi2集成了共享功能模块，以促进模态协作，并引入了一个适应模态的模块，以保留模态特定特征。广泛的实验表明，mPLUG-Owi2能够同时泛化文本任务和多模态任务，并以单一通用模型实现最先进的性能。值得注意的是，mPLUG-Owl2是第一个在纯文本和多模态场景中展示模态协作现象的 MLLM 模型，为未来的多模态基础模型的发展开辟了先河。

2024-12-09

Transformers:视觉变形器的鲁棒中心凹视觉感知

由于残留连接中的深度降解效应Tions，许多高效的Vision Transformers模型依赖于在用于信息交换的堆叠层上，常常无法进行形成足够的信息混合，导致不自然的维-通常的感知。为了解决这个问题，本文提出了聚合注意力，这是一种基于仿生设计的标记混合器，它模拟了生物视锥视觉和连续眼球运动，同时使特征图上的每个标记都具有全局感知。此外，我们还加入了与常规查询和密钥交互的可学习的标记，这使得亲和矩阵的生成更加多样化，而不仅仅是依赖于查询和密匙之间的相似性。我们的方法不依赖于堆叠的信息交换，从而有效地避免深度退化，实现自然的视觉感受。此外，我们提出卷积GLU，一种连接GLU和SE机制的通道混合器，它使每个令牌能够基于其最近的图像特征进行通道注意力，从而增强局部建模能力和模型的鲁棒性。我们将聚合注意力和卷积GLU相结合，创建了一个新的视觉骨干网络称为TransNeXt。广泛的实验表明，我们的TransNeXt在多个模型大小上实现了最先进的性能。在2242的分辨率下，TransNeXt-Tiny在ImageNet上的准确率为84.0%

2024-12-09

halcon目标检测案例

解释文档 https://blog.youkuaiyun.com/qq_65356682/article/details/144259505?spm=1001.2014.3001.5502 通过异常检测，我们想要检测图像是否包含异常。异常指的是偏离常规的、未知的东西。异常检测的例子：输入图像的每个像素都被分配了一个值，该值表明该像素是异常的可能性有多大。一个异常检测模型学习没有异常的图像的共同特征。训练后的模型将推断出输入图像只包含学习过的特征的可能性有多大，还是该图像包含不同的东西。后一个被解释为异常。此推理结果作为灰度图像返回。其中的像素值表示输入图像像素中相应像素显示异常的可能性有多大。预处理数据需要转换数据集的信息内容。这是通过函数read_dl_dataset_anomaly来完成的。它创建了一个字典DLDataset，它充当一个数据库，存储关于您的数据的所有必要信息。要了解更多关于数据及其传输方式的信息，请参阅下面的“数据”一节和深度学习/模型一章。拆分字典DLDataset表示的数据集。这可以使用函数split_dl_dataset来完成。

2024-12-05

C#打包成一个安装软件的教程

打包教程 https://blog.youkuaiyun.com/qq_65356682/article/details/144063254?spm=1001.2014.3001.5502

2024-11-26

PP-OCR-V3-V4模型包含训练模型以及推理模型

PaddleOCR是一个基于飞桨开发的OCR（Optical Character Recognition，光学字符识别）系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。以下是其优点：高精度：PaddleOCR采用深度学习算法进行训练，可以在不同场景下实现高精度的文字检测和文字识别。多语种支持：PaddleOCR支持多种语言的文字识别，包括中文、英文、日语、韩语等。同时，它还支持多种不同文字类型的识别，如手写字、印刷体、表格等。高效性：PaddleOCR的训练和推理过程都采用了高效的并行计算方法，可大幅提高处理速度。同时，其轻量化设计也使得PaddleOCR能够在移动设备上进行部署，适用于各种场景的应用。易用性：PaddleOCR提供了丰富的API接口和文档说明，用户可以快速进行模型集成和部署，实现自定义的OCR功能。同时，其开源代码也为用户提供了更好的灵活性和可扩展性。鲁棒性：PaddleOCR采用了多种数据增强技术和模型融合策略，能够有效地应对图像噪声、光照变化等干扰因素，并提高模型的鲁棒性和稳定性。总之，PaddleOCR具有高精度、

2024-11-25

C# 部署 YoloV10目标检测 .net framework4.8,打开即用内有（主程序和dll生成程序）

训练使用可在这里查看 https://blog.youkuaiyun.com/qq_65356682/article/details/142250076?spm=1001.2014.3001.5502 YOLOv10引入了无NMS的一致双分配训练策略，结合了一对多和一对一分配策略的优势。在训练过程中，模型利用一对多分配的丰富监督信号，而在推理过程中则使用一对一分配的预测结果，从而实现无NMS的高效推理。一致匹配度量：为确保两个分支的预测感知匹配，YOLOv10提出了一致匹配度量，通过调整匹配度量参数，使得一对一和一对多分配的监督信号一致，减少了训练期间的监督差距，提升了模型的预测质量。效率-精度驱动的模型设计： YOLOv10在模型设计上采用了多种技术来降低计算成本，同时保持较高的检测性能。这包括轻量化分类头、空间-通道解耦下采样、基于秩的块设计、大核卷积和部分自注意力模块等。

2024-09-14

免费 halcon 异常检测训练代码和推理代码

本代码程序免费，可以下载使用。下载好后用halcon20以上的版本打开代码文件，准备好数据集导入，然后F5训练，再打开推理代码，进行模型推理，完整的流程和参数打开代码文件就可以看到通过异常检测，我们想要检测图像是否包含异常。异常指的是偏离常规的、未知的东西。异常检测的例子：输入图像的每个像素都被分配了一个值，该值表明该像素是异常的可能性有多大。一个异常检测模型学习没有异常的图像的共同特征。训练后的模型将推断出输入图像只包含学习过的特征的可能性有多大，还是该图像包含不同的东西。后一个被解释为异常。此推理结果作为灰度图像返回。其中的像素值表示输入图像像素中相应像素显示异常的可能性有多大。预处理数据需要转换数据集的信息内容。这是通过函数read_dl_dataset_anomaly来完成的。它创建了一个字典DLDataset，它充当一个数据库，存储关于您的数据的所有必要信息。要了解更多关于数据及其传输方式的信息，请参阅下面的“数据”一节和深度学习/模型一章。拆分字典DLDataset表示的数据集。这可以使用函数split_dl_dataset来完成。

2024-09-02

TA关注的人

labelme中文标注工具双击exe即可直接运行

Unet语义分割训练源码包含（数据集标注后的转化脚本和预训练模型）

XAnyLabelimg-obb标注软件打开exe即可 可自动标注

Labelimg-1.8.6最新版本exe，内有其源码，以及自动标注的源码文件

YoloV10+C#部署（.NET Framework）内有dll生成程序

paddleocr预训练模型

PaddleOCR-main（可训练可标注一体，内置推理脚本）（这个版本可正常训练，亲测可用）

C# 读取 Yolov11 转换的onnx模型进行模型推理

C#+Yolov8+onnx net6.0目标检测推理

从本地实时拿图显示到窗口中并接收tcp发送的信号转为字符串显示在窗体中实现检测可视化

C#读取yolov5模型onnx进行模型推理.net461版本附赠(.net461和.net6.0之间的转换)

pycharm社区版本免费可用

Anaconda3-2021.11-Windows-x86-64安装包

Yolov11最新的源码文件包含（训练，转化，推理）脚本文件

yolov8obb训练源码

C#实现PaddleSharp

visionpro案例（零件尺寸测量与显示，硬币统计，骰子点数统计）等

3D目标检测案例以及源码

语义分割论文以及源码文件

图像生成(Image Generation)

目标检测(Object Detection)

多模态大语言模型(MLLM)

Transformers:视觉变形器的鲁棒中心凹视觉感知

halcon目标检测案例

C#打包成一个安装软件的教程

PP-OCR-V3-V4模型包含训练模型以及推理模型

C# 部署 YoloV10目标检测 .net framework4.8,打开即用内有（主程序和dll生成程序）

免费 halcon 异常检测 训练代码和推理代码

（免费）C#读取yolov8的实例分割onnx模型完整源码

(免费)yolo各个版本的训练模型转化的onnx模型，可以先用

yolov10优化代码，包含，train.py,detect.py,export.py脚本以及预训练模型

(增+免费已标注pcb数据集)PCB coco数据集638张样本 yolov5

python39+opencv的各种图片批量处理脚本包含（批量文件改名，批量图片缩放，批量图片全局直方图和局部直方图均衡化）等等

PCB数据集yolo可读取，coco数据集

免费yolo算法的改进的各个注意力机制

将yolov5 train编译成exe并运行训练部分时，在开始迭代训练的时候，总是重复打开ui界面

XAnyLabelimg-obb标注软件打开exe即可可自动标注

免费 halcon 异常检测训练代码和推理代码