- 博客(72)
- 收藏
- 关注
原创 模型训练篇
几何变换:随机旋转(±15°)、平移(±10%)、缩放(0.8-1.2 倍)。像素级增强:颜色抖动(Hue ±5, Saturation ±15%)、高斯模糊(σ=0.5)。高级技巧:Mosaic 混合四张图像(YOLOv5 首创)、Copy-Paste 粘贴小目标至复杂背景。
2025-12-26 16:06:44
917
原创 图像分割篇
(1)高斯滤波(降噪)目的:平滑图像,减少噪声对边缘检测的影响;(2)计算梯度幅值和方向(3)非极大值抑制目的:细化边缘,消除边缘检测带来的杂散响应原理:比较当前像素梯度幅值与梯度方向上的相邻像素实现方法:例如:如果梯度方向为0°(水平),比较左右像素如果梯度方向为45°,比较东北和西南对角线像素(4)双阈值检测目的:确定真实边缘和潜在边缘方法:阈值选择策略:(5)滞后边缘跟踪目的:连接断开的边缘,去除鼓励的弱边缘原理:基于弱边缘是否与强边缘连通实现流程:二、基于深度学习的方法1、F
2025-12-26 15:07:43
716
原创 图像分类篇
ResNeSt(ResNeSplit-t)是2020年提出的ResNet改进版本,核心创新在于Split-Attention机制,巧妙结合了多分支架构和通道注意力机制。MobileViT 是一个专门为移动设备设计的轻量级视觉 Transformer 模型,在模型大小和推理速度之间取得了良好平衡。这类模型在经典的CNN骨干网络(如ResNet)中嵌入轻量级的注意力模块,让网络能自适应地关注更重要的特征通道或空间区域。使用Split-Attention模块,替代了ResNet的残差块。
2025-12-25 14:22:17
671
原创 目标跟踪篇
多目标跟踪的主要任务是:在给定视频中同时对多个感兴趣的目标进行定位,并且维持他们的ID、记录他们的轨迹。TBD(Tracking-by-Detection)策略:先检测,后跟踪。
2025-12-23 14:25:54
425
原创 Triton_Objectdet总体部署流程
一、开发环境准备工作1、进入终端后,不显示工作目录,输入命令bash2、打开vscode,不能远程notebook上传vscode-server;apt install openssh-serverservice ssh restart3、密码不对,拒绝访问cd /passwd4、容器镜像使用triton_runtime_20210406 或 triton_lhh二、模型转换1、对于标牌检测和交通灯的模型, 需要进入到 convert_onnx_script 文件夹先把 pytor
2022-03-04 17:52:56
1418
原创 常用的c++功能和函数
1、计算iou定义float iou(BBox_struct sign_box, BBox_struct box2){ int x1 = std::max(sign_box.x, box2.x); int y1 = std::max(sign_box.y, box2.y); int x2 = std::min((sign_box.x + sign_box.w), (box2.x + box2.w)); int y2 = std::min((sign_box.y + si
2022-01-13 11:17:26
1137
原创 pytorch+resnest101分类模型
参考项目地址:https://github.com/MachineLP/PyTorch_image_classifier一:数据检查和增删二:对每张图片进行重命名在Resnext-pytorch/process_data/rename.py先把名字随便改一下然后再统一改回来三:数据的上传解压将整个文件夹放在/data目录下,名字为img对文件或者文件夹重命名都可以用mv filename1 filename2四:图片的检查把一些空的,出错的图片删除:tools/check.py五、开始
2021-12-24 10:34:44
627
1
原创 yolox训练验证自己VOC格式的数据集
官网地址代码:https://github.com/Megvii-BaseDetection/YOLOX训练过程参考:深入浅出Yolox之自有数据集训练超详细教程训练命令:python tools/train.py -f exps/example/yolox_voc/yolox_voc_s.py -d 0 -b 8 -c backup/yolox_s.pth验证命令:python tools/eval.py -f exps/examples/yolox_voc/yolox_voc_s.py -c
2021-10-12 15:29:12
1779
1
原创 Excel打开CSV单元格格式怎么设置为文本
用代码生成的CSV,用Excel打开,总是默认为常规,设置为文本,关上打开又变成常规了不会的点Excel的帮助文档就好了
2021-09-18 16:50:47
7048
原创 针对ipeak lite工具链的K80模型在线模型发布
总的来说,就是,用c++进行推理,然后把推理代码,封装成python可以调用的库。这里有两个工程代码,Demo封装了python,YOLO是纯C++的推理代码一、C++推理trafficsigninference-YOLO工程./demo/demo.cpp里调用了一个类:DrivingDetector;这个类的定义和具体实现是在./sdk/detection_driving_lib.cpp里;1、在./sdk下,make编译生成libdetection_driving.so(1)./sd
2021-08-30 17:35:50
658
原创 基于mmclassification框架,ResNeSt-50网络训练标牌细分类模型
项目地址:https://github.com/open-mmlab/mmclassification参考1:https://blog.youkuaiyun.com/weixin_34910922/article/details/107801656参考2:https://blog.youkuaiyun.com/weixin_43216130/article/details/115312600这两篇博文都写的很仔细,谢谢这两位同学一、环境安装1、首先查看python的版本2、再查看cuda和pytorch的版本,是否对应
2021-08-05 14:59:09
1987
原创 Darknet自带的tracker跟踪功能
一、编译选项的修改1、darknet/src/yolo_console_dll.cpp取消注释 #define TRACK_OPTFLOW2、Makefile 编译选项打开开关 LIBSO=1二、编译make cleanmake -j4三、遇到的Error编译时可能会遇到:cannot find the file opencv_cudaoptflow.h1、彻底的解决方法是重新安装编译带CUDA的OpenCV2、简单的一种解决方法是修改 #if defined(TRACK_O
2021-07-07 11:09:07
1174
原创 可视化工具VisualTool的使用
一、主工具的安装(1)解压Debug.zip,进入解压后的文件夹,双击VisualToolKits.exe(2)如果出现下图的bug,则进入步骤二。二、.NET Framework的安装(1)双击打开NDP472-DevPack-enu.exe(2)同意协议,点击安装安装成功后,返回步骤一。(3)如果遇到下图bug,则进入步骤三三、添加信任证书(1)Win+R 打开运行,输入mmc,确定。(2)文件→添加/删除管理单元(3)添加证书(4)选择 计算机账户→下一步→完
2021-03-30 16:38:46
3168
原创 多目标跟踪(MOT,Multiple Object Tracking)预研
参考链接:https://www.cnblogs.com/xiaozhi_5638/p/13845413.html IT周见智1、介绍多目标跟踪(Multiple Object Tracking,MOT),是对连续视频画面中多个目标进行跟踪,跟踪的本质是关联视频前后帧中同一物体(目标),并赋予唯一TrackID。2、绝大多数MOT算法的四大步骤:检测特征提取、运动预测相似度计算数据关联目标视觉跟踪,分为两大类方法:生成(generative)模型方法和判别(discriminative)模
2021-02-09 10:51:28
2402
原创 AI平台训练YOLO模型的步骤流程总结
一、挂载数据数据集的筛选很重要,注意数据是否存在编码混乱和标注错误二、数据预处理1、所有类别数据整合1.1 检查图片和标签的后缀是否正确执行脚本,这个脚本在AI平台被注释掉了,一般是存在图片的后缀".jpg",被误写为".JPG",遇到新的数据集则最好运行一下改脚本,以防还存在其他的错误后缀,判断后缀脚本如下:import osimport shutilroot_dir = "/root/data1125/"dst_dir = "/root/store-data_new/crop1125
2021-02-01 14:56:59
2535
1
原创 singleshotpose基于2D图像实现3D输出
代码地址:https://github.com/Microsoft/singleshotpose论文地址:Real-Time Seamless Single Shot 6D Object Pose Prediction五、训练python3 train.py --datacfg kitti/kitti.data --modelcfg kitti/yolo-pose.cfg --initweightfile cfg/darknet19_448.conv.23 --pretrain_num_epochs
2020-11-18 11:37:09
1664
12
原创 AB版本的Darknet使用心得
Darknet有两个版本:一个YOLO v3原作者的版本,这个只能适用Linux:https://pjreddie.com/darknet/yolo/https://github.com/pjreddie/darknet另一个是AB大神的版本,适用于Linux和Windows:https://github.com/AlexeyAB/darknet这篇主要说一下我关于AB版本的使用心得。参考:https://blog.youkuaiyun.com/just_sort/article/details/1039
2020-11-05 17:12:54
2032
原创 pytorch初学记录
win10 安装参考链接 https://www.cnblogs.com/guohaoblog/p/10340360.html1、试了好多教程,都行不通2、首先安装pytorch打开anaconda,里面搜索torch,安装3、安装torch首先打开安装torch的虚拟环境https://blog.youkuaiyun.com/qq_38723677/article/details/81144457然后 pip3 install --no-deps torchvisionUbuntu 安装直接一条命
2020-11-04 16:11:11
578
原创 XML的简单基础
一、XML简介XML可扩展标记语言(EXtensible Markup Language)被用来传输和存储数据,其焦点是数据的内容,XML是不作为的。二、XML树结构XML文档形成了一种树结构,它从“根部”开始,然后扩展到“枝叶”。以VOC2007数据集中一个xml文件为例:第一行是XML声明,它定义XML版本1.0;下一行 <annotation>是描述文档的根元素;接下来是子元素,以及子元素的子元素;最后一行</annotation>定义根元素的结尾。所有元素均
2020-09-23 10:04:54
668
原创 linux常用的解压缩命令
1、打包成tar.gz格式压缩包tar -zcvf renwolesshel.tar.gz /renwolesshel2、解压tar.gz格式压缩包 tar zxvf renwolesshel.tar.gz3、压缩成zip格式zip -q -r renwolesshel.zip renwolesshel/实例:将 /home/html/ 这个目录下所有文件和文件夹打包为当前目录下的 html.zip:zip -q -r html.zip /home/html如果在我们在 /home
2020-09-23 09:11:31
588
原创 yolov3训练自己的数据
开始训练./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg weights/darknet53.conv.74
2020-09-15 11:34:51
620
原创 the mathtype dll cannot be found
the mathtype dll cannot be found应该是安装位置不对,重新卸载,安装在C盘的默认位置就好了
2020-09-07 09:17:17
730
原创 腾讯优图开源项目TNN总结与实践
一、Github的license1、开源软件的License,一般是授权用户使用、拷贝、修改和再发布的合法权利及应当遵守的约定,同时包含作者的免责声明和使用自担责声明。2、使用合适的开源许可证可以给开发者/使用者避免一些不必要的麻烦事情。3、我还是不明白我再这里写TNN的总结,会不会侵权,知道的谢谢留言。开源软件为什么要有授权为什么开源项目要选择License二、如何进行模型转换1、目前TNN仅支持CNN,支持主流的模型文件格式,包括ONNX、PyTorch、Tensorflow以及Caffe
2020-08-28 14:41:39
2828
原创 YOLOV3 和 YOLOV5 模型在 TNN 中的 Inference 原理
参考 https://blog.youkuaiyun.com/u011984148/article/details/99439791参考 https://blog.youkuaiyun.com/taifengzikai/article/details/86500753小狗的图片是描述原理最清楚的,也不知道原作者是谁,感谢原作者一、参数介绍对于yolov3来说,有三个输出,分别是:从第一个输出到下一个输出,都经过了一个上采样层,所以feature会依次扩大一倍;stride是降采样的倍数,例如 13*32=416为图
2020-08-28 14:40:27
42
原创 MXNet的安装
一、多线程开发1、多线程是如何实现同步的?二、Linux系统三、C++四、计算机系统结构五、CUDA六、Pthread,MPI,OpenMP,OenCL
2020-08-20 12:25:48
1970
原创 基于LSTM的MAC协议识别
基于LSTM的MAC协议识别一、生成数据分类数据为四种协议类型:生成代码如下:(如果需要可以私聊我)生成的数据格式如下:二、数据预处理1、首先生成对应的标签数据:y_test.txt和y_train.txtf1 = open('E:\\PycharmProjects\\data\\y_test.txt', 'w')for i in range(0, 5000): f1...
2020-08-20 10:53:20
867
1
原创 layer_param_block, remainder = remainder.split(‘\n\n‘, 1) ValueError: not enough values to unpack
笔记1、python split 的用法#!/usr/bin/python# -*- coding: UTF-8 -*-str = "Line1-abcdef \nLine2-abc \nLine4-abcd";print(str.split("\n")) # 以空格为分隔符,包含 \nprint(str.split("\n", 1)) # 以空格为分隔符,分隔成两个,分割一次print(str.split("\n", 2)) #分割两次,分割成了三个2、回车”(Carriage Re
2020-08-20 10:52:24
843
原创 Ubuntu安装OpenCV的c++接口
参考链接1参考链接2参考链接3一、下载OpenCV下载链接选择一个相对稳定的版本,Ubuntu环境最好下载 tar.gz二、安装依赖sudo apt-get install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-devsudo apt-get install python-dev python-numpy
2020-08-20 10:12:58
907
原创 服务器重启之后 Is the docker daemon running?
sudo service docker restartsudo systemctl start dockercentos的系统一般不用service这个指令,要用systemctl
2020-08-18 13:51:11
1829
原创 vscode远程调试cmake程序
一、添加编译器二、配置CMakeLists.txt的路径File Preferences Remote 搜索框搜索cmake三、配置build的路径四、依次CMake、Build、Debugcmake的时候完全不需要编写launch.json和tasks.json,这个是gdb编译用的
2020-08-13 09:51:03
3085
3
原创 基于VSCode的远程调试容器中的代码
一、准备工作cd /data02/lhh/workspacesudo cp ~/vscode-server-for-v1.38.1-2020.3.13.tar.gz ./# sudo cp ../TNN/TNN/TNN-feature_demo ./# 报错:cp:omitting#这是因为TNN-feature_demo目录下还有目录sudo cp -r ../TNN/TNN/TNN-feature_demo ./cd ~#查看镜像列表sudo docker images二、基于
2020-08-12 09:17:36
1931
2
原创 安装cpu版本的MXNet
课程目录第一课:从上手到分类1.1、安装cpu版本的MXNet1.2、nd库的矩阵运算1.3、自动求导1.4、scratch版本的线性回归1.5、gluon版本的线性回归1.6、scratch版本的逻辑回归第一课:从上手到分类1.1、安装cpu版本的MXNet说实话,我没有看懂李沐大神的安装步骤,因为我之前安装过MXNet,所以李沐大神的这里我就跳过了,直接上我从前的安装步骤吧:>p...
2019-09-26 22:47:23
2133
原创 C++笔记19-09-05
文章目录一、C++字符串反转二、C++类模板三、交换函数swap四、C++中数组定义及初始化五、C++输出换行符一、C++字符串反转代码:#include <iostream> using namespace std;void Reverse(char *s, int n) { for (int i = 0, j = n - 1; i < j; i++, j--)...
2019-09-06 17:22:33
552
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅