自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 资源 (8)
  • 收藏
  • 关注

原创 caffe-ssd在windows上运行的一些问题

终于搭建好caffe-ssd的环境,编译也通过了。 感谢: https://blog.youkuaiyun.com/Chen_yingpeng/article/details/59056245 https://blog.youkuaiyun.com/gxb0505/article/details/73702451 https://blog.youkuaiyun.com/samylee/article/details/5258...

2018-04-12 15:01:42 1327 1

原创 Yolov3 darknet: ./src/cuda.c:36: check_error: Assertion `0' failed.

调试YOLOv3时,想测试GPU效果。报错如下: 搜索网上的解决方法,有很多人说是因为GPU计算力不匹配的问题,建议修改 –gpu-architecture=compute_52, –gpu-code=compute_52. 为 –gpu-architecture=compute_30, –gpu-code=compute_30 然并卵! 只需要在执行时加上 sudo 即可!!! ...

2018-03-30 14:58:32 19067 21

原创 Python图像处理:行向求和、列向求和

做图像做处理时,会有对图像行向求和、列向求和的需求。利用Python-opencv实现如下。

2023-04-13 10:52:25 847

原创 pip install xxx, UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte.....illegal multibyte sequence

打开文件时,没有指定编码格式,encoding = None,故报错,需要指定编码格式

2022-09-06 15:42:41 1318

转载 yolov5 冻结网络

参考github上的指导1、找到train.py中的freeze # Freeze freeze = [] # parameter names to freeze (full or partial) for k, v in model.named_parameters(): v.requires_grad = True # train all layers if any(x in k for x in freeze): print('freezin

2022-03-31 10:45:06 5620

原创 yolov5-5.0转换ncnn在安卓平台的应用

yolov5-5.0转换ncnn在安卓上应用1、NCNN编译2、pt转onnx3、onnx转ncnn4、安卓端部署5、问题及解决本文的编译应用环境及用到的编译工具为Win10、pycharm、VS2015、Android Studio.1、NCNN编译腾讯官方的介绍:ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖,跨平台,手机端 cpu 的速度快于目前所有已知的开源框架。基于 ncnn,开发者能够将深度学习算法轻松移植到手机端

2022-03-17 17:31:09 5357 3

转载 透视变换(Perspective Transform)

**透视变换(Perspective Transform)**是将图片投影到一个新的视角或平面,变换公式如下。在之前的章节中我们学习过仿射变换(affine transform) 可以看到,而射变换的变换矩阵是3x2的变换矩阵。和仿射变换不同的是,透视变换的变换矩阵是一个3x3的矩阵。透视变换的作用域是一个三维坐标系(x,y,z), 而仿射变换则是二维(x,y)平面变换。从另一个角度来说,仿射变换也可以看做是一种特殊的透视变换(z轴方向不变)。透视变换和仿射变换的一个重要区别是,两条平行的线在经过仿射

2022-01-28 13:30:41 1945 5

转载 U2-Net-显著目标检测(SOD)

转自:https://blog.youkuaiyun.com/xuzz_498100208/article/details/109912302论文:https://arxiv.org/pdf/2005.09007.pdf 代码:https://codeload.github.com/NathanUA/U-2-Net/zip/master U2net是基于unet提出的一种新的网络结构,同样基于encode-decode,作者参考FPN,Unet,在此基础之上提出了一种新模块RSU(ReSidual U-block

2022-01-26 17:58:23 1566

原创 Yolov5-6.0训练自己的数据

1、准备数据总体文件结构如下:数据文件夹格式与VOC数据类似,包括**images(train、val)和labels(train、val)**文件夹,分别存放图片和对应的标注txt文件。2、修改配置文件样本准备完毕后,修改配置文件,与yolov4的准备过程类似,cfg与超参文件。2.1 axtc.yaml文件拷贝coco128.yaml修改为自己的文件。修改train、val文件夹路径,以及自己的类别数量及名称。2.2 Yolovs.yaml文件根据自己的需要,修改对应的网络

2022-01-20 15:31:22 4110

原创 onnxruntime-gpu使用问题

使用onnx+GPU推理yolov4/v5模型的时候报错:warnings.warn(“Cannot load onnxruntime.capi. Error: ‘{0}’”.format(str(e)))Traceback (most recent call last):File “D:\Program\pyDev\Anaconda\envs\pytorch\lib\site-packages\onnxruntime_init_.py”, line 12, in from onnxruntime.

2022-01-13 16:13:19 6351 2

原创 海康设备NVR、IPC取rtsp流格式

★目前海康录像机、网络摄像机,网络球机的RTSP单播取流格式如下(车载录像机不支持RTSP取流):rtsp://用户名:密码@IP:554/Streaming/Channels/101→录像机示例:取第1个通道的主码流预览rtsp://admin:hik12345@10.16.4.25:554/Streaming/Channels/101取第1个通道的子码流预览rtsp://admin:hik12345@10.16.4.25:554/Streaming/Channels/102取第1个通道的第

2021-07-30 14:24:55 10248 1

转载 欠拟合与过拟合的概念

在训练模型的过程中,我们通常希望达到以下两个目的:1、训练的损失值尽可能地小。2、训练的损失值与测试的损失值之间的差距尽可能地小。当第一个目的没有达到时,则说明模型没有训练出很好的效果,模型对于判别数据的模式或特征的能力不强,则认为它是欠拟合的。当第一个目的达到,第二个没有达到时,说明模型训练出了很好的效果,而测试的损失值比较大,则说明模型在新的数据上的表现很差,此时可认为模型过度拟合训练的数据,而对于未参与训练的数据不具备很好的判别或拟合能力,这种情况下,模型是过拟合的。用一个通俗的例子来说明:

2021-06-15 09:08:23 2385 1

原创 Ubuntu18.04安装CUDA11.1+cudnn8.0.5+TensorRT7.2

安装过程趟了很多坑,记录一下。硬件:Tesla T4系统:Ubuntu18.04 华为服务器目标:安装cuda11.1+cudnn8.01、驱动安装ubuntu-driver devices 查看合适的驱动sudo apt install nvidia-driver-450-server驱动安装成功!2、安装cuda离线下载CUDA11.1.0参考:https://cyfeng.science/2020/05/02/ubuntu-install-nvidia-driver-cu

2021-04-21 11:13:17 5420

原创 跟踪算法总结

目前业内公认效果比较好的跟踪算法:Deep-sort和FairMOT,二者主要区别在于:FairMOT是一个集成检测、跟踪的端到端算法,检测部分基于centerNet,跟踪部分类似deep-sort。个人认为跟踪算法性能的优劣取决于两方面:(1)检测器的性能;(2)跟踪策略。常用的检测网络:单阶检测:(1)YOLOv3/YOLOv4;(2)centerNet;(3)RefineDet;两阶检测:(1)faster-Rcnn对比FairMOT和yolov4+deep_sort的实际效果:

2020-11-25 11:59:28 10130 1

转载 TCP/UDP 网络通信

转自:https://www.cnblogs.com/ydjy/p/3942437.htmlC++ 利用socket实现TCP,UDP网络通讯学习孙鑫老师的vc++深入浅出,有一段时间了,第一次接触socket说实话有点儿看不懂,第一次基本上是看他说一句我写一句完成的,第二次在看SOCKET多少有点儿感觉了,接下来我把利用SOCKET完成TCP和UDP两种通讯模式的流程和代码分享一下,希望对大家多少能有点儿帮助,有什么说的不对的欢迎各位大神指正。TCP TCP是点对点的通讯模式,数据传输质量高,对

2020-11-16 15:33:54 226

转载 FairMOT论文解读

论文地址:https://arxiv.org/abs/2004.01888 摘要 近年来,作为多目标跟踪的核心组件的目标检测和重新识别取得了显着进展。 但是,很少有人关注在单个网络中完成两项任务以提高推理速度。 沿此路径进行的初始尝试最终导致结果降低,这主要是因为未正确学习重新标识分支。 在这项工作中,我们研究了故障背后的根本原因,并因此提出了解决问题的简单基准。 它以30 fps的速度远远超过了公共数据集的最新水平。 我们希望这个基准可以启发并帮助评估该领域的新想法。 可以在https://gith

2020-10-16 14:13:55 1759

转载 从Deep-sort到FairMOT

转自:https://zhuanlan.zhihu.com/p/260292966?utm_source=wechat_session目标跟踪分为单目标跟踪(SOT)和多目标跟踪(MOT)。SOT一般在首帧给出目标,跟踪器(tracker)需要在后续帧定位出目标位置,可以看成目标重定位问题。MOT一般需要检测器(detector)先检测出目标,跟踪器对属于同一目标的框进行关联,可以看作目标匹配问题。下文重点介绍MOT算法。MOT算法的通常工作流程:(1)给定视频的原始帧;(2)运行对象检测器以获得对象

2020-10-14 14:37:16 3339

转载 anchor free和anchor based的区别

anchor-free 和 anchor-based 区别几何这个问题首先需要回答为什么要有 anchor。在深度学习时代,物体检测问题通常都被建模成对一些候选区域进行分类和回归的问题。在单阶段检测器中,这些候选区域就是通过滑窗方式产生的 anchor;在两阶段检测器中,候选区域是 RPN 生成的 proposal,但是 RPN 本身仍然是对滑窗方式产生的 anchor 进行分类和回归。而在上面几篇论文的 anchor-free 方法中,是通过另外一种手段来解决检测问题的。同样分为两个子问题,即确定物体

2020-10-10 14:21:47 3268

原创 Yolo-v4 训练过程中Segmentation fault (core dumped)出错原因分析

训练Yolo-v4过程中总是失败,报错“Segmentation fault (core dumped)”根据网上的提示原因无外乎有三:(1)内存爆;(2)出现野指针;(3)数据本身的问题;比较纠结的在Windows上可以正常训练,但在Ubuntu上总出问题。我用的显卡是RTX2080ti,根据nvidia-smi显示显卡才用了60%左右;数据已经核验了一遍,没有标记空框的情况!用gdb调试后,有了重大发现!居然读图失败!之后出现地址访问不到的问题!按照提示的图片查看数据,发现该图片的后缀

2020-07-21 10:06:16 3568

转载 YOLO-v4网络结构解析

转自:https://blog.youkuaiyun.com/weixin_41560402/article/details/1061197741. 概述现阶段的目标检测器主要由4部分组成:Input、Backbone、Neck、Head。YOLOv4模型由以下部分组成:CSPDarknet53作为骨干网络BackBone;SPP作为Neck的附加模块,PANet作为Neck的特征融合模块;YOLOv3作为Head。2. 网络分块解析2.0 先睹为快我们可以使用模型结构可视化工具Netron

2020-07-20 10:01:12 3776 2

原创 Ubuntu桌面卡死解决办法

不需要重启!!!不需要重启!!!不需要重启!!!我出现卡死的现象是鼠标可以动,但是点击任何地方都没反应,终端也调不出来。按Ctrl+Alt+F1可以进入tty终端输入账号和密码进行登录,注意,这一步不要使用小键盘执行命令注销桌面重新登录输入命令:ps -t tty7可以看到 有一个Xorg的进程Ubuntu桌面卡死解决办法-风君子博客然后输入如下命令:sudo pkill Xorg或者sudo restart lightdm命令执行后,界面会显示登录框,输

2020-07-17 11:14:52 3155

转载 (转)Deep_sort代码分析

写的太好了,情不自禁转载了转自:https://blog.youkuaiyun.com/sgfmby1994/article/details/98517210 重新排版太烦了,word写完直接截图过来了..... 

2020-06-17 17:34:17 454

转载 卡尔曼滤波的解释

转自:https://www.jianshu.com/p/d3b1c3d307e0卡尔曼滤波在我当学生的时候就用过,但是当年我似乎就是套公式,没有理解其精髓,加之时间久了有点模糊,突然需要指导学生使用,有了强烈的陌生感觉,不得不逼自己再一次捡起。自己学会和教会别人是学习的两个层次,为了自我提高,也为了更好得指导学生。于是,我又翻出自己当年写的算法以及在网上找了些大神写的资料,进行融会贯通,总结提炼,希望稍微有点大学概率论的人能够看懂此文并熟练使用。为了可以更加容易得理解卡尔曼滤波器,我们先回顾了基础的

2020-06-15 14:54:50 1310

转载 简单粗暴理解匈牙利算法

转自:https://blog.youkuaiyun.com/dark_scope/article/details/8880547 【书本上的算法往往讲得非常复杂,我和我的朋友计划用一些简单通俗的例子来描述算法的流程】匈牙利算法是由匈牙利数学家Edmonds于1965年提出,因而得名。匈牙利算法是基于Hall定理中充分性证明的思想,它是部图匹配最常见的算法,该算法的核心就是寻找增广路径,它是一种

2020-06-15 09:16:03 375

转载 (转)Tensorflow 实战Google深度学习框架 读书笔记

<div class="rich_media_content" id="js_content"> <p style="white-space:normal;color:rgb(51,51,51);tex...

2020-06-06 11:25:24 1502

转载 (转)正则化方法在深度学习中的应用

深度学习中,卷积神经网络和循环神经网络等深度模型在各种复杂的任务中表现十分优秀。例如卷积神经网络(CNN)这种由生物启发而诞生的网络,它基于数学的卷积运算而能检测大量的图像特征,因此可用于解决多种图像视觉应用、目标分类和语音识别等问题。但是,深层网络架构的学习要求大量数据,对计算能力的要求很高。神经元和...

2020-06-04 16:19:19 1436

转载 TensorFlow训练分类模型及Finetune实操

转自:https://blog.youkuaiyun.com/czp_374/article/details/81133641写的太好了!!! 这篇文章关注的重点是如何使用

2020-05-27 11:16:51 3095

转载 tensorflow中slim下的分类网络训练自己的数据集以及fine-tune

转载自:https://blog.youkuaiyun.com/stesha_chen/article/details/81976415谢谢大佬,这是我见过最适合入门者的文档。 目录前期准备训练flower数据集(包括fine-tuning)训练自己的数据集(包括fine-tuning) 前

2020-05-26 08:55:05 645

原创 faster_rcnn_inception_v2_coco.config的解析

参考:https://blog.youkuaiyun.com/wubingwei12/article/details/88184140model { faster_rcnn { num_classes: 3 //获取要识别的类数 image_resizer { keep_aspect_ratio_resizer { min_dimension: 128 //最小的图片像素 max_dimension: 1024 //最大的图片像素 }

2020-05-16 11:38:27 2145

原创 windows7+VS2017+GPU+OpenCV3.4 编译YOLO_v4

随着AlexAB大神将YOLO继续发扬光大到V4之后,一大波yolo粉狂欢了一阵,但是对于初学者想用却遇到了麻烦,因为环境配置永远是头疼的。准备工作VS2017OpenCV3.4CUDA10.1(+cudnn)其他版本亦可,取决于你显卡的配置,我的是Titan Xpdarknet 源码(https://github.com/AlexeyAB/darknet)配置环境2.1 创建VS...

2020-05-08 10:42:40 1046 1

转载 卷积滤波核的设计

转载自:https://blog.youkuaiyun.com/xue_csdn/article/details/99077718参考:https://www.cnblogs.com/zongfa/p/9130167.html卷积核就是一个二维mxm矩阵。二维图像与二维矩阵卷积之后的结果,就实现了对图像的滤波。卷积核一般有以下一些规则:m的大小应该是奇数,这样它才有一个中心,例如3x3,5x5或者7...

2020-03-31 16:20:02 3403 1

转载 caffe中meanvalue与meanfile的解析

转自:https://blog.youkuaiyun.com/yangdashi888/article/details/79340195 1、caffe使用的mean_是为了图像像素值能更接近(0,0)...

2020-03-25 16:34:30 723

原创 卷积的通俗解释

在 https://www.cnblogs.com/alexanderkun/p/8149059.html 上看到关于卷积的一个“血腥”的讲解比如说你的老板命令你干活,你却到楼下打台球去了,后来被老板发现,他非常气愤,扇了你一巴掌(注意,这就是输入信号,脉冲),于是你的脸上会渐渐地(贱贱地)鼓起来一个包,你的脸就是一个系统,而鼓起来的包就是你的脸对巴掌的响应,好,这样就和信号系统建立起来意义对应...

2019-08-28 16:21:37 354 1

转载 信息熵的理解

信息是我们一直在谈论的东西,但信息这个概念本身依然比较抽象。在百度百科中的定义:信息,泛指人类社会传播的一切内容,指音讯、消息、通信系统传输和处理的对象。 但信息可不可以被量化,怎样量化?答案当然是有的,那就是“信息熵”。早在1948年,香农(Shannon)在他著名的《通信的数学原理》论文中指出:“信息是用来消除随机不确定性的东西”,并提出了“信息熵”的概念(借用了热力学中熵的概念),来解...

2019-08-23 11:32:16 2212

转载 基于caffe框架遇到的特殊层

转自:https://blog.youkuaiyun.com/xg123321123/article/details/52610919Batch Normalization意义: 网络训练时,用来加速收敛速度提醒: 已经将BN集成为一个layer了,使用时需要和scale层一起使用训练的时候,将BN层的use_global_stats设置为false; 测试的时候将use_global_sta...

2019-07-19 10:19:28 206

转载 解读RetinaNet

转自:https://blog.youkuaiyun.com/JNingWei/article/details/80038594众所周知,detector主要分为以下两大门派: - one stage系 two stage系 代表性算法 YOLOv1、SSD、YOLOv2、YOLOv3 R-CNN、SPPNet、Fast R-CNN、Faster R-CNN 检...

2019-07-18 14:04:29 4533

转载 目标检测算法总结(R-CNN、Fast R-CNN、Faster R-CNN、FPN、YOLO、SSD、RetinaNet)

转自:https://www.cnblogs.com/guoyaohua/p/8994246.html目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息。本文对目标检测进行了整体回顾,第一部分从RCNN开始介绍基于候选区域的目标检测器,包括Fast R-CNN、Faster R-CNN 和 FPN等。第二部分则重点讨论了包括YOLO、...

2019-07-16 10:46:02 2028

转载 修改xml文件节点文本

转自:https://blog.youkuaiyun.com/myruo/article/details/87884856比说把source节点的文本值1改为2因为获取文本值用的是 GetText() 函数,所以想当然的想使用 SetText,然后悲剧的发现只有SetValue然后用了 SetValue,发现改变的是节点的名字,而不是节点的文本内容。具体解决办法如下://text是element的...

2019-05-30 10:51:43 1212

原创 视频质量检测(5)--视频遮挡诊断

本文主要介绍视频遮挡的诊断。1、亮度异常的定义视频画面中由于人为或非人为因素导致设置的监控区域画面上有大面积的遮挡。2、算法思路图像发生遮挡时:(1)对应的区域必然会模糊,边缘信息减少;(2)该区域的像素方差也减小。基于此,对图像做边缘检测,分别对边缘图和原图求方差。为了提高诊断准确率,可将图分成N*N块,分别对小块进行诊断,满足条件认为该帧图像遮挡。3、代码实现话不多说,直接上代码...

2019-05-23 09:13:24 8161 5

原创 libjpeg-turbo的使用

平时都用OpenCV的imwrite存图,保存为bmp格式的图片,速度快但占用空间大;存为jpg格式,占用空间小但存图时间长。了解到libjpeg这个开源库存图,实验了一下,老版的libjpeg与OpenCV相比,没有优势。新版的libjpeg-turbo就不一样了,存图效率很高。(1)从官网下载最新版本的libjpeg-turbo(2)安装.exe文件,解压压缩包(3)应用参考do...

2019-05-05 11:55:38 8636 1

gflags0.3.3+glog2.0源码压缩包

该版本含有.sln文件及vsprojects文件夹,可根据需要编译不同版本的库文件,现在网上比较难找到。

2018-04-20

SSD-windows所需的hungarian.h和hungarian.cpp

caffe-ssd-windows编译所需的3rdparty文件hungarian.h和hungarian.cpp

2018-04-11

人脸实时识别

基于seetaface和libface进行的人脸检测、对齐、识别。seetaface的三个模型文件需要下载(下载地址https://github.com/seetaface/SeetaFaceEngine)放进model文件夹中,配置opencv。忽略高分,看疗效!

2017-11-30

人脸3D姿态预测

采用eos库进行的人脸3D角度计算(pitch、yaw、roll),结合opencv采集人脸图像。需要:(1)自行下载并配置boost库,(2)按照自己的库(opencv、eos、boost)地址配置工程属性。希望大家成功!

2017-11-30

Tessract训练字库步骤

本教程为Tessract训练新字库的步骤,按教程说明一定可以训练出新的语言字库。

2016-07-01

Tessract VS环境配置

Tessract是谷歌开源的OCK库,识别效率不错。在使用中配置是个问题,本人结合操作过程将配置形成文档,以供参考。

2016-06-13

Adaboost算法之个人理解

本文档是本人在学习Adaboost算法过程中的心得体会,是学习中的重点提取,可以帮助初学者理解。

2015-02-03

AAM算法原理介绍

本文档是本人关于AAM算法的理解,包括特征点标定、形状、纹理、混合外观模型的建立,最后包括AAM的匹配。

2014-12-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除