自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(120)
  • 资源 (2)
  • 收藏
  • 关注

原创 YoloV11训练自己的训练集

(2)加载官方的预训练模型的话,它训练的imgsz是从官方的预训练模型里加载,所以如果在model.train的时候不设置imgsz的话,默认就是640,即使修改yaml文件的imgsz,还是会被640覆盖。(1)V11的超参数保存在cfg下的default.yaml文件,模型所需要的超参数会从那边获取。训练需要准备的东西:(1)数据集的yaml文件 (2)预训练模型。(1)yaml文件里的path输入的是训练数据集所在目录。训练完之后模型文件会保存在代码目录下的run文件夹里。

2024-12-13 11:29:01 185

原创 深度学习模型训练记录

(1)情况1:预训练权重是基于1000个类别进行训练的,而自己的数据只有几十类。解决方法:在加载权重的时候不加载最后的全连接层。

2024-12-03 10:42:31 106

原创 PPOCRV4用predict_det.py推理有结果用predict_system.py推理没结果

原因:rec模型效果太差,导致识别出来的阈值太低。在predict_system.py代码中,如果识别模型的得分太低,则不会将检测框绘制出来,所以就看不到结果。

2024-11-21 10:26:22 340

原创 解决PPOCRV4检测框比实际检测目标大

unclip_ratio参数可以调整输出检测框的大小,默认值是1.5所以检测框比目标大,改成1.0。修改Det训练时对应的yaml文件:例如 ch_PP-OCRv4_det_cml.yml。

2024-11-21 10:22:45 501

原创 load library failed: libnvidia-ml.so.1: cannot open shared object file: no such

原因:安装docker的时候勾选的是Hyper-V而不是WSL,重新安装docker desktop的时候勾选WSL就解决了。具体原因还是不太清楚,可能是wsl对于驱动的支持比Hyper-V更好。Windows系统在使用docker创建容器加载Gpu的时候报这个错误,显示找不到该文件,但查看本地又有这个文件。

2024-11-08 11:16:41 515

原创 Docker 操作指令

docker run -it --name 容器名称 -v 本地磁盘路径:/容器内部路径 镜像名称。8.如果已经创建了容器,可以把本地文件复制到容器内(要先启动容器)docker run -it --name 容器名称 镜像名称。7.挂载本地磁盘到docker工作目录(在创建容器的时候挂载)docker cp 本地文件路径 容器id:/容器内部路径。6.删除容器(如果容器在运行的话要先停止)3.创建容器(一个镜像可以创建多个容器)docker stop 容器名称。docker rm 容器名称。

2024-11-08 10:42:47 456

原创 windows环境下配置Mamba所需的库

解决在windows环境下安装mamba_ssm以及causal_conv等库经常出bug的问题,使用编译好的whl文件,下载即可直接使用。方便上手,减少配置环境所消耗的不必要时间

2024-09-13 10:48:42 397

原创 Visual Studio配置opencv环境

(4)配置链接器(如果配置的是debug模式则输入结尾为****d.lib的, 如果是release模式则去掉d,我的opencv版本是480,需要根据自己版本进行修改)(2)配置opencv的include和opencv2路径,具体路径和版本根据自己电脑配置。(1)打开属性页面(鼠标放在解决方案上,点击右键会有一个属性选项弹出)(3)配置opencv的lib文件(库目录)(5)测试代码(图片路径自行修改)

2024-09-13 10:23:21 564

原创 CMake学习记录一(windows)

自动搜索可能需要的程序、库和头文件的能力;独立的构建目录(如build),可以安全清理支持复杂的自定义命令(下载、生成各种文件)自定义配置可选组件从简单的文本文件()自动生成工作区和项目的能力在主流平台上自动生成文件依赖项并支持并行构建几乎支持所有的ID。

2024-08-14 17:14:03 474

原创 windows使用vscode和cmake编译报错error C2001: 常量中有换行符

解决方法:修改通过编码保存的格式为GBK。

2024-08-14 14:36:45 278

原创 VSCode在windows系统下编译动态链接库不生成Lib文件

这句话放在前面才可以生成lib文件,放在最后面不会生成lib。解决方法:在CMakeLists.txt文件加入。

2024-08-14 11:46:11 504

原创 目标检测之单类别NMS

在目标检测中,常见的是多类别NMS,也就是只对相同类别的boxes来计算IOU;但现实场景中经常遇到同一个物体被识别成2个类别,也就是模型认为它既是类别1也是类别2.这时候通过多类别nms就过滤不掉这种重叠的框。在官方的代码中已经有boxes, class_probs, nms_threshold这三个参数的输出,我们只需把它传入上面的函数就可以了。在官方yolo的基础上修改代码如下(注释掉的是官方原始的代码)这个函数的三个输入参数分别是:模型检测得到的框(x,y,w,h)、 每个框的得分、nms阈值。

2024-07-15 21:32:22 423

原创 YOLOV10训练集制作+Train+Val记录

yolov10训练预测

2024-07-02 14:32:59 671

原创 tensorrt动态batch推理注意事项

Pt文件转onnx文件再转engine文件需要注意的事项,tensorrt处理一个batch的数据

2024-06-26 16:24:55 488 5

原创 onnx转openvino模型(2022版本和2024版本)

网上很多方法都是用openvino自带的mo_onnx.py来转的,但个人下载的2022和2024版都没见到这些文件。(2)2024版openvino: python安装openvino2024的库,和2022的区别在于接口变了.(1)2022版openvino:python需要安装对应版本的openvino库(以2022.3.0为例)

2024-06-18 13:24:14 776

原创 vs2022配置openvino环境(无需修改系统环境变量)

一键配置openvino,无需添加到系统环境变量中

2024-06-18 13:15:41 501

原创 ValueError: Expect x to not have duplicates

报错原因:scipy版本问题,将1.10.1版本降为1.7.1就可以解决了。

2024-06-12 10:25:34 615

原创 Pytorch语义分割(2)--------模型搭建

经典的模型还是Unet,也可以使用torch自带的unet来训练,但为了更好地了解,还是选择自己搭建。

2024-06-06 11:31:47 384

原创 OSError: Can t load tokenizer for bert-base-chinese . If you were trying to load it from

所需下载的文件地址:https://pan.baidu.com/s/1trIXxXzqaYXoyJZaSQ11hA?,看网上分析说是连接不上外网导致的,需要科学上网。但使用科学上网也会发生其他类型的错误,索性就直接将模型下载到本地。背景:使用hugging face 中的。

2024-06-05 10:15:47 923

原创 Pytorch语义分割(1)-----加载数据

在语义分割中用到的数据无非就是原始图片(image)和标注后得到的mask图片,所以在读取数据的时候只要返回图片和标签信息就OK 了。

2024-06-04 20:31:25 463

原创 cv::Point小记录

使用第一种方式给cv::Point 进行赋值,不会报错,但是输出坐标的时候会有问题。正确赋值方式应该是第二种。

2024-06-03 14:01:47 238

原创 Windows系统安装openvino(2024.1.0)

windows系统安装openvino 2024以及测试样例

2024-05-31 14:03:49 2153

原创 C++乱码转为UTF-8,GBKToUTF8, UTF8ToGBK

【代码】C++乱码转为UTF-8。

2024-05-30 13:40:04 373

原创 根据坐标进行排序

分享一个简单的坐标排序,可用于yolo输出的boxes进行排序。此排序适用于倾斜角度不大的情况,如果文本倾斜过多,排序结果可能有问题。

2024-05-27 21:38:22 281

转载 labelme生成的json文件转成txt文件

【代码】labelme生成的json文件转成txt文件。

2024-05-20 16:58:48 718

原创 urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed:

解决方法:

2024-05-14 13:34:22 115

原创 PaddleOCRv4训练自己的模型(5)-------自带的标注软件的坑

解决方法:标注完多边形之后,点击界面右上角的重新识别,然后重启软件。再打开就会发现标注变多了,然后将自己开始标注的删掉,只留下重新识别后生成的标注。比如下面这张图,多边形标注完之后,再导出识别结果,在crop_img文件夹里面却没有。可以发现重新生成的标注都是矩形或斜矩形,这时候再导出识别结果就会在crop_img里面存图了。1.默认读图方式是cv2.imread(),不支持中文路径,所以标注的文件夹最好不要有中中文。原因:ppocr只支持矩形或斜矩形的标注方式。但软件又没有斜矩形标注。

2024-05-11 08:35:40 476

原创 PaddleOcrV4 使用ch_PP-OCRv4_det_cml.yml训练报错

报错原因是因为在这个yml文件里有两个Student的网络是PPLCNetNew,但在主干网络里面没有这个网络,所以报错。解决方法:把PPLCNetNew改成PPLCNetV3,然后再加 det:true。还有一个Student2也是同样修改。

2024-04-21 23:40:18 978

原创 PaddleOCRV4训练自己的模型(4)------模型推理及导出

(2)配置运行参数,这个py文件在代码里面的rec_char_dict_path参数默认是./ppocr/utils/ppocr_keys_v1.txt,用cmd窗口跑的话可能没问题,但是用pycharm来跑的话会报错找不到这个文件。(1)在训练Rec的时候是只对文字部分进行训练的,推理的时候如果输入整图,推理时间可能会增加,效果可能也会下降(没测试过) infer_rec.py的输出结果是一个TXT文件,一行对应每一张图的输出结果。因为训练定位模型的时候是整图训练,所以推理的时候也是整图推理。

2024-04-21 23:29:35 2441 5

原创 PaddleOCR训练自己的模型(3)-----模型推理

(1)Det模型推理: 打开infer_det.py文件, 配置运行参数((2)Rec模型推理:打开infer_rec.py文件, 配置参数。运行完之后输出结果会保存在。

2024-04-18 23:22:13 692

原创 PaddleOCR训练自己模型(2)----参数配置及训练

paddleocr分为文字定位(Det)和文字识别(Rec)两个部分。训练paddleocr

2024-04-16 22:46:04 1839 4

原创 PaddleOCR训练自己模型(1)----数据准备

paddleocr训练--数据准备

2024-04-16 00:09:01 1152 14

原创 解决PPOCRLabel.py报错operands could not be broadcast together with shapes (213,488,4) (1,1,3)

解决PPOCRLabel.py报错operands could not be broadcast together with shapes (213,488,4) (1,1,3)

2024-03-20 22:00:26 772

原创 cv2.error: OpenCV(4.9.0) C:\projects\opencv-python\opencv\modules\highgui\src\window.cpp:658: error:

python使用opencv读取图片没有问题,但是使用imshow的时候报错。cv2.error: OpenCV(3.4.9) C:\projects\opencv-python\opencv\modules\highgui\src\window.cpp:658: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Carbon support

2024-03-20 21:47:01 5355 2

原创 YOLOV9训练集制作+Train+Val记录

在images文件夹下面存放的是图片,在label文件夹下面存放的是TXT文件,每一个txt文件里面都是标注的信息。把标注得到的xml文件放到一个文件夹中,比如要搞训练集(train)的就只把train的xml文件放到一个文件夹里,不要把val和test的放进来。修改完之后直接运行会报错,代码有个小bug需要修改。运行完之后会在生成对应的txt文件,将文件复制粘贴到yolov9的dataset文件夹的对应位置就OK了。弄完之后,打开train.py文件,在train.py文件下面加上一行,防止报错。

2024-03-04 16:02:58 6339 22

原创 生成voc格式数据集

数据集存放格式:(Annotations文件夹放标注的xml文件,JPEGImages文件夹放标注的图片)

2024-02-29 23:06:14 288

原创 torch1.13保存模型中文路径报错

在torch.save的时候加上_use_new_zipfile_serialization=False,默认这个参数是True。

2024-02-28 15:58:08 482

原创 visual studio2022使用tensorRT配置

下载好TensorRT和对应的cuda之后,把tensorRT的锻炼了和lib文件复制粘贴到cuda对应的文件夹中,以方便调用。完成之后点击应用保存,然后配置就好了。这时候调用invinfer.h等相关的文件就没问题了。只记录tensorRT在vs中使用时的配置,下载和安装的 文章主页自己寻找。完成之后打开vs新建一个tensorRT的项目,然后开始配置。

2024-02-22 22:47:18 824

原创 Windows下载安装vcpkg并使用它来安装第三方库(visualstudio)

在下载库之前它会先下载一个powershell的压缩包,但是这个压缩包下载的非常慢,所以建议复制对应的网址,使用迅雷下载(网址就是图片中https://github........这一大段)2.下载好之后解压打开文件夹,双击bootstrap-vcpkg.bat文件,如果成功的话会在文件夹里生成一个vcpkg.exe文件。下载完成之后放到vcpkg文件夹下面的downloads文件夹里,然后再重新执行第4步的命令。下载比较慢,个人比较喜欢打开下面网址然后用迅雷下载,速度飞快。

2024-01-17 02:47:45 3208

原创 Opencv基础用法学习2

在opencv中的读图方式是BGR,常见的读图方式是RGB。

2024-01-16 20:27:28 583

golang爬虫第一版代码

golang爬虫第一版代码

2022-04-11

这是一个demo实战的代码1

这是一个demo实战的代码1

2022-02-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除