- 博客(11)
- 收藏
- 关注
原创 模型压缩:量化、剪枝和蒸馏
深度学习网络模型从卷积层到全连接层存在着大量冗余的参数,大量神经元激活值趋近于0,将这些神经元去除后可以表现出同样的模型表达能力,这种情况被称为过参数化,而对应的技术则被称为模型剪枝。2)学生模型训练:学生模型一般为参数量很小,结构相对简单的模型,简称为Model-S,其训练过程以学习Model-T 为主,而不是学习数据的真实标签。在知识蒸馏使用的教师-学生(Teacher-Student)网络中,教师模型是“知识”的输出者,学生模型是“知识”的接受者,整个过程分为两个阶段。
2024-09-10 16:29:06
518
原创 海康、大华 摄像头、硬盘录像机NVR RTSP协议取流规则
RTSP简介RTSP(Real Time Streaming Protocol)实时流,是TCP/IP协议体系中的一个应用层协议。该协议定义了一对多的应用程序如何有效地通过IP网络传送多媒体数据,用于C/S模式,使用RTSP时客户端和服务端都可以发出请求,故RTSP可以是双向的。RTSP默认使用UDP建立连接,端口是554。
2024-09-05 21:53:09
2993
原创 项目实战:PyTorch实现Yolov5目标检测算法
基于PyTorch实现Yolov5算法,作为Yolov5算法的复现。可以帮助读者更好的理解它的网络结构、训练流程、损失计算等。读者也可以使用该仓库训练自己的数据集,项目代码可在github获取。
2024-09-03 13:42:20
1630
4
原创 目标检测评价指标详解(mAP、AP、FPS)
map(mean Average Precision,平均准确度均值)平均正确率(AP),准确率 (Accuracy),精确率(Precision),召回率(Recall)。FPS(即每秒处理的图片数量或者处理每张图片所需的时间,在同一硬件条件下进行比较)
2024-09-01 14:09:34
1247
原创 Triton部署PPOCRv4模型
本文介绍如何使用Triton模型推理框架来部署百度的PPOCRv4模型。主要包括Triton Inference Server安装、PPOCRv4的Paddle模型转TensorRT模型、TensorRT模型部署和模型推理验证。
2024-08-31 16:27:21
1578
4
原创 Visual Studio:C++程序配置Opencv环境
OpenCV(Open Source Computer Vision Library)是一个广泛使用的开源计算机视觉库,旨在提供丰富的图像和视频处理功能。OpenCV可以通过C++、Python、Java等编程语言调用,使得开发者能够在不同平台上进行图像处理和计算机视觉应用程序的开发。作为一个全面且强大的计算机视觉库,OpenCV包含了数百个用于图像处理、特征检测、对象识别、视频分析等领域的函数和工具。
2024-08-28 15:33:50
2362
原创 项目实战:deepsort+Yolov5实现一个简单的多目标追踪器
项目基于deepsort和Yolov5实现了一个简单的船舶追踪算法,deepsort是一个基于检测的目标追踪算法,可以方便的替换检测算法。Yolov5是船舶检测模型,使用onnx模型进行推理,也可以替换为自己的检测模型。项目中追踪和检测分模块进行实现,方便替换自己的的检测算法模型。
2024-08-16 18:11:58
551
原创 项目实战:Torch实现简单分类网络
这是一个简单的resnet实现猫狗分类例子,项目代码可在github获取,包含如下内容:1)神经网络实现分类的原理2)了解模型优化流程:数据处理、损失计算、反向传播等3)熟悉如何使用torch加载图片数据、搭建模型、训练模型。
2024-08-16 13:19:57
1939
原创 零基础学习Deepsort目标追踪
多目标跟踪,一般简称为MOT(Multiple Object Tracking),也有一些文献称作MTT(Multiple Target Tracking)。在事先不知道目标数量的情况下,对视频中的行人、汽车、动物等多个目标进行检测并赋予ID进行轨迹跟踪。不同的目标拥有不同的ID,以便实现后续的轨迹预测、精准查找等工作。MOT从形式上分为Online(只考虑当前帧及之前的信息)和Batch(可以用到后面的帧的信息)两种模式,考虑实用性主要还是Online跟踪的方法。
2024-05-22 16:41:12
1030
1
原创 零基础Yolov5学习
Yolov5是一种基于anchor的单阶段目标检测算法,通过卷积神经网络对图片进行特征提取,然后对图片进行密集预测,输出目标的类别和位置信息,从而将目标检测任务变成分类和回归任务。Yolov5将整张图像划分为若干个网格,每个网格负责预测落在该网格内物体的种类和位置信息,预测信息:各类别的概率分数,边界框包含目标的置信度和实际框相对于预设框的偏移量。通过数据训练来优化模型的分类和边界框回归,实现目标检测任务。通过对模型输出解码和NMS非极大值抑制得到最终的检测结果。
2024-05-16 15:15:47
2060
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人