上天夭-优快云博客

原创模型训练篇

几何变换：随机旋转（±15°）、平移（±10%）、缩放（0.8-1.2 倍）。像素级增强：颜色抖动（Hue ±5, Saturation ±15%）、高斯模糊（σ=0.5）。高级技巧：Mosaic 混合四张图像（YOLOv5 首创）、Copy-Paste 粘贴小目标至复杂背景。

2025-12-26 16:06:44 917

（1）高斯滤波（降噪）目的：平滑图像，减少噪声对边缘检测的影响；（2）计算梯度幅值和方向（3）非极大值抑制目的：细化边缘，消除边缘检测带来的杂散响应原理：比较当前像素梯度幅值与梯度方向上的相邻像素实现方法：例如：如果梯度方向为0°（水平），比较左右像素如果梯度方向为45°，比较东北和西南对角线像素（4）双阈值检测目的：确定真实边缘和潜在边缘方法：阈值选择策略：（5）滞后边缘跟踪目的：连接断开的边缘，去除鼓励的弱边缘原理：基于弱边缘是否与强边缘连通实现流程：二、基于深度学习的方法1、F

2025-12-26 15:07:43 716

原创图像分类篇

ResNeSt（ResNeSplit-t）是2020年提出的ResNet改进版本，核心创新在于Split-Attention机制，巧妙结合了多分支架构和通道注意力机制。MobileViT 是一个专门为移动设备设计的轻量级视觉 Transformer 模型，在模型大小和推理速度之间取得了良好平衡。这类模型在经典的CNN骨干网络（如ResNet）中嵌入轻量级的注意力模块，让网络能自适应地关注更重要的特征通道或空间区域。使用Split-Attention模块，替代了ResNet的残差块。

2025-12-25 14:22:17 671

原创目标跟踪篇

多目标跟踪的主要任务是：在给定视频中同时对多个感兴趣的目标进行定位，并且维持他们的ID、记录他们的轨迹。TBD（Tracking-by-Detection）策略：先检测，后跟踪。

2025-12-23 14:25:54 425

原创目标检测篇

端到端就是将输入到输出的全部处理步骤整合进一个统一的模型进行联合学习和优化，无需独立设计或训练中间模块。

2025-12-22 18:21:14 941

原创 PyTorch的Dataloader模块解析

过采样少数类，保持类别平衡# 每个少数类样本采样2次。

2025-12-01 09:46:19 496

原创 TritonObjDet新增要素的方法

上一篇文章的补充

2022-07-14 14:24:56 1038

原创 Triton_Objectdet总体部署流程

一、开发环境准备工作1、进入终端后，不显示工作目录，输入命令bash2、打开vscode，不能远程notebook上传vscode-server;apt install openssh-serverservice ssh restart3、密码不对，拒绝访问cd /passwd4、容器镜像使用triton_runtime_20210406 或 triton_lhh二、模型转换1、对于标牌检测和交通灯的模型, 需要进入到 convert_onnx_script 文件夹先把 pytor

2022-03-04 17:52:56 1418

原创常用的c++功能和函数

1、计算iou定义float iou(BBox_struct sign_box, BBox_struct box2){ int x1 = std::max(sign_box.x, box2.x); int y1 = std::max(sign_box.y, box2.y); int x2 = std::min((sign_box.x + sign_box.w), (box2.x + box2.w)); int y2 = std::min((sign_box.y + si

2022-01-13 11:17:26 1137

原创 pytorch+resnest101分类模型

参考项目地址：https://github.com/MachineLP/PyTorch_image_classifier一：数据检查和增删二：对每张图片进行重命名在Resnext-pytorch/process_data/rename.py先把名字随便改一下然后再统一改回来三：数据的上传解压将整个文件夹放在/data目录下，名字为img对文件或者文件夹重命名都可以用mv filename1 filename2四：图片的检查把一些空的，出错的图片删除：tools/check.py五、开始

2021-12-24 10:34:44 627 1

原创 yolox训练验证自己VOC格式的数据集

官网地址代码：https://github.com/Megvii-BaseDetection/YOLOX训练过程参考：深入浅出Yolox之自有数据集训练超详细教程训练命令：python tools/train.py -f exps/example/yolox_voc/yolox_voc_s.py -d 0 -b 8 -c backup/yolox_s.pth验证命令：python tools/eval.py -f exps/examples/yolox_voc/yolox_voc_s.py -c

2021-10-12 15:29:12 1779 1

原创 Excel打开CSV单元格格式怎么设置为文本

用代码生成的CSV，用Excel打开，总是默认为常规，设置为文本，关上打开又变成常规了不会的点Excel的帮助文档就好了

2021-09-18 16:50:47 7048

原创针对ipeak lite工具链的K80模型在线模型发布

总的来说，就是，用c++进行推理，然后把推理代码，封装成python可以调用的库。这里有两个工程代码，Demo封装了python，YOLO是纯C++的推理代码一、C++推理trafficsigninference-YOLO工程./demo/demo.cpp里调用了一个类：DrivingDetector；这个类的定义和具体实现是在./sdk/detection_driving_lib.cpp里；1、在./sdk下，make编译生成libdetection_driving.so（1）./sd

2021-08-30 17:35:50 658

原创基于mmclassification框架，ResNeSt-50网络训练标牌细分类模型

项目地址：https://github.com/open-mmlab/mmclassification参考1：https://blog.youkuaiyun.com/weixin_34910922/article/details/107801656参考2：https://blog.youkuaiyun.com/weixin_43216130/article/details/115312600这两篇博文都写的很仔细，谢谢这两位同学一、环境安装1、首先查看python的版本2、再查看cuda和pytorch的版本，是否对应

2021-08-05 14:59:09 1987

原创 Darknet自带的tracker跟踪功能

一、编译选项的修改1、darknet/src/yolo_console_dll.cpp取消注释 #define TRACK_OPTFLOW2、Makefile 编译选项打开开关 LIBSO=1二、编译make cleanmake -j4三、遇到的Error编译时可能会遇到：cannot find the file opencv_cudaoptflow.h1、彻底的解决方法是重新安装编译带CUDA的OpenCV2、简单的一种解决方法是修改 #if defined（TRACK_O

2021-07-07 11:09:07 1174

原创可视化工具VisualTool的使用

一、主工具的安装（1）解压Debug.zip，进入解压后的文件夹，双击VisualToolKits.exe（2）如果出现下图的bug，则进入步骤二。二、.NET Framework的安装（1）双击打开NDP472-DevPack-enu.exe（2）同意协议，点击安装安装成功后，返回步骤一。（3）如果遇到下图bug，则进入步骤三三、添加信任证书（1）Win+R 打开运行，输入mmc，确定。（2）文件→添加/删除管理单元（3）添加证书（4）选择计算机账户→下一步→完

2021-03-30 16:38:46 3168

原创多目标跟踪（MOT，Multiple Object Tracking）预研

参考链接：https://www.cnblogs.com/xiaozhi_5638/p/13845413.html IT周见智1、介绍多目标跟踪（Multiple Object Tracking,MOT），是对连续视频画面中多个目标进行跟踪，跟踪的本质是关联视频前后帧中同一物体（目标），并赋予唯一TrackID。2、绝大多数MOT算法的四大步骤：检测特征提取、运动预测相似度计算数据关联目标视觉跟踪，分为两大类方法：生成（generative）模型方法和判别（discriminative）模

2021-02-09 10:51:28 2402

原创 AI平台训练YOLO模型的步骤流程总结

一、挂载数据数据集的筛选很重要，注意数据是否存在编码混乱和标注错误二、数据预处理1、所有类别数据整合1.1 检查图片和标签的后缀是否正确执行脚本，这个脚本在AI平台被注释掉了，一般是存在图片的后缀".jpg"，被误写为".JPG",遇到新的数据集则最好运行一下改脚本，以防还存在其他的错误后缀，判断后缀脚本如下:import osimport shutilroot_dir = "/root/data1125/"dst_dir = "/root/store-data_new/crop1125

2021-02-01 14:56:59 2535 1

原创 pycharm导入同级目录有红色波浪线

pycharm导入同级目录有红色波浪线需要把上级目录设置为source root

2020-12-14 17:34:43 968

转载 VScode远程断点debug

Ubuntu —— 软件使用 :: VSCode断点调试Python

2020-12-03 10:14:18 3640

原创 singleshotpose基于2D图像实现3D输出

代码地址：https://github.com/Microsoft/singleshotpose论文地址：Real-Time Seamless Single Shot 6D Object Pose Prediction五、训练python3 train.py --datacfg kitti/kitti.data --modelcfg kitti/yolo-pose.cfg --initweightfile cfg/darknet19_448.conv.23 --pretrain_num_epochs

2020-11-18 11:37:09 1664 12

原创 make报错chmod +x *.sh

解决办法make clean重新编译make -j4

2020-11-13 09:54:22 2764 3

原创 AB版本的Darknet使用心得

Darknet有两个版本：一个YOLO v3原作者的版本，这个只能适用Linux：https://pjreddie.com/darknet/yolo/https://github.com/pjreddie/darknet另一个是AB大神的版本，适用于Linux和Windows:https://github.com/AlexeyAB/darknet这篇主要说一下我关于AB版本的使用心得。参考：https://blog.youkuaiyun.com/just_sort/article/details/1039

2020-11-05 17:12:54 2032

原创 pytorch初学记录

win10 安装参考链接 https://www.cnblogs.com/guohaoblog/p/10340360.html1、试了好多教程，都行不通2、首先安装pytorch打开anaconda,里面搜索torch，安装3、安装torch首先打开安装torch的虚拟环境https://blog.youkuaiyun.com/qq_38723677/article/details/81144457然后 pip3 install --no-deps torchvisionUbuntu 安装直接一条命

2020-11-04 16:11:11 578

原创 XML的简单基础

一、XML简介XML可扩展标记语言（EXtensible Markup Language）被用来传输和存储数据，其焦点是数据的内容，XML是不作为的。二、XML树结构XML文档形成了一种树结构，它从“根部”开始，然后扩展到“枝叶”。以VOC2007数据集中一个xml文件为例：第一行是XML声明，它定义XML版本1.0;下一行 <annotation>是描述文档的根元素;接下来是子元素，以及子元素的子元素；最后一行</annotation>定义根元素的结尾。所有元素均

2020-09-23 10:04:54 668

原创 linux常用的解压缩命令

1、打包成tar.gz格式压缩包tar -zcvf renwolesshel.tar.gz /renwolesshel2、解压tar.gz格式压缩包 tar zxvf renwolesshel.tar.gz3、压缩成zip格式zip -q -r renwolesshel.zip renwolesshel/实例：将 /home/html/ 这个目录下所有文件和文件夹打包为当前目录下的 html.zip：zip -q -r html.zip /home/html如果在我们在 /home

2020-09-23 09:11:31 588

原创 yolov3训练自己的数据

开始训练./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg weights/darknet53.conv.74

2020-09-15 11:34:51 620

原创安装python接口的OpenCV

pip install opencv-python

2020-09-15 09:20:30 617

原创 the mathtype dll cannot be found

the mathtype dll cannot be found应该是安装位置不对，重新卸载，安装在C盘的默认位置就好了

2020-09-07 09:17:17 730

原创腾讯优图开源项目TNN总结与实践

一、Github的license1、开源软件的License，一般是授权用户使用、拷贝、修改和再发布的合法权利及应当遵守的约定，同时包含作者的免责声明和使用自担责声明。2、使用合适的开源许可证可以给开发者/使用者避免一些不必要的麻烦事情。3、我还是不明白我再这里写TNN的总结，会不会侵权，知道的谢谢留言。开源软件为什么要有授权为什么开源项目要选择License二、如何进行模型转换1、目前TNN仅支持CNN，支持主流的模型文件格式，包括ONNX、PyTorch、Tensorflow以及Caffe

2020-08-28 14:41:39 2828

原创 YOLOV3 和 YOLOV5 模型在 TNN 中的 Inference 原理

参考 https://blog.youkuaiyun.com/u011984148/article/details/99439791参考 https://blog.youkuaiyun.com/taifengzikai/article/details/86500753小狗的图片是描述原理最清楚的，也不知道原作者是谁，感谢原作者一、参数介绍对于yolov3来说，有三个输出，分别是：从第一个输出到下一个输出，都经过了一个上采样层，所以feature会依次扩大一倍；stride是降采样的倍数，例如 13*32=416为图

2020-08-28 14:40:27 42

空空如也

空空如也