
计算机视觉
文章平均质量分 62
zhqh100
这个作者很懒,什么都没留下…
展开
-
深度增强学习射击类游戏(vizdoom)
深度强化学习玩DoomGame原创 2022-06-30 10:22:00 · 2329 阅读 · 0 评论 -
PaddlePaddle 尚不支持 Ubuntu22.04
(base) luke@luke-NH5x-7xRCx-RDx:~$ pythonPython 3.9.7 (default, Sep 16 2021, 13:09:58) [GCC 7.5.0] :: Anaconda, Inc. on linuxType "help", "copyright", "credits" or "license" for more information.>>> import paddleError: Can not import avx cor.原创 2022-04-25 17:36:06 · 5242 阅读 · 4 评论 -
jetson nano 用 tensorrt 运行 nanodet(kitti数据集)
题目是目标,我们先一步一步来做,第一步是训练神经网络, 我用的是 kitti 数据集,训练顺序为,第一步,拿到kitti数据集,第二步,把kitti数据集修改为voc数据集格式,第三步,修改配置文件进行训练关于前两步,是copy自KITTI车辆检测数据集转VOC格式(亲测成功,附KITTI云盘连接以及完整格式转换代码)- KITTI车辆检测数据集看着一篇就够了!_Hurri_cane的博客-优快云博客_kitti数据集车辆检测他这个转xml的脚本稍微改改路径就可以直接运行了,然后就是训练,原创 2022-03-30 10:08:04 · 3727 阅读 · 1 评论 -
一次失败的Pytorch模型量化尝试
我的原工程模型是blazeface学习笔记_zhqh100的博客-优快云博客完整的应该是一个人脸识别项目,人脸识别,大言不惭的说,我之前其实也做过,比如用dlib来做人脸识别,就是用opencv那一套来实现,说句实在话,速度非常慢,即便是在intel CPU上,一秒也就两三帧,确实是太慢了我其实也用过其他方案,比如前几年,下载虹软的免费的库,进行试用,效果确实惊人,给我印象最深刻的,倒不是识别准确度有多高,而是速度真的飞快,我也试过MTCNN,这个只要网上搜索人脸检测,基本都是搜到这个结果,我也尝试过,我原创 2022-03-25 18:04:05 · 8077 阅读 · 6 评论 -
blazeface学习笔记
完整的应该是一个人脸识别项目,人脸识别,大言不惭的说,我之前其实也做过,比如用dlib来做人脸识别,就是用opencv那一套来实现,说句实在话,速度非常慢,即便是在intel CPU上,一秒也就两三帧,确实是太慢了我其实也用过其他方案,比如前几年,下载虹软的免费的库,进行试用,效果确实惊人,给我印象最深刻的,倒不是识别准确度有多高,而是速度真的飞快,我也试过MTCNN,这个只要网上搜索人脸检测,基本都是搜到这个结果,我也尝试过,我不知道别人是如何夸奖这个库的,我试用的体会就是,经常误识别,就是本来就原创 2022-03-23 19:16:36 · 2961 阅读 · 0 评论 -
LaneATT调试笔记
代码地址为 https://github.com/lucastabelini/LaneATThttps://github.com/lucastabelini/LaneATT首先说这个Label,因为input肯定是一张图片,这个毫无疑问,这个Label的构建主要是在LaneDataset中,该类首先构建一个dataset,比如我这里是TuSimple,其数据集的Label是车道线的标点,不过是十行(像素)取一个x点的坐标,所以lane就是x点坐标,而h_samples就是y的坐标,主要也就是一个json原创 2022-03-18 22:09:24 · 1781 阅读 · 7 评论 -
训练LaneATT遇到CUDA_HOME环境变量问题
我系统装了很久了,不记得之前CUDA是咋装了,然后训练神经网络一直也没啥问题,今天想学习LaneATT,车道线识别的项目,需要先安装nms,遇到如下问题:(base) luke@luke-NH5x-7xRCx-RDx:~/Download/study/LaneATT/lib/nms$ python setup.py Traceback (most recent call last): File "setup.py", line 7, in <module> ext_modul原创 2022-02-24 21:32:02 · 3906 阅读 · 5 评论 -
NanodetPlus网络调试笔记
根据GitHub - RangiLyu/nanodet: NanoDet-Plus⚡Super fast and lightweight anchor-free object detection model. ????Only 980 KB(int8) / 1.8MB (fp16) and run 97FPS on cellphone????调试得出backbone 为 'ShuffleNetV2'根据 nanodet_custom_xml_dataset.yml 的默认配置,默认输入尺寸为原创 2022-02-19 21:02:14 · 522 阅读 · 0 评论 -
nanodet训练voc数据集
class_names: &class_names ['aeroplane','bicycle','bird','boat','bottle','bus','car','cat','chair','cow','diningtable','dog','horse','motorbike','person','pottedplant','sheep','sofa','train','tvmonitor']num_classes: 20原创 2022-02-17 14:50:31 · 2535 阅读 · 3 评论 -
YOLOv3学习笔记
代码为https://github.com/Peterisfar/YOLOV3.git神经网络输入尺寸 input_sizeimg.size()torch.Size([1, 3, 544, 544])从darknet53中获取特征x_s, x_m, x_l = self.__backnone(x)x_s.size()torch.Size([1, 256, 68, 68])x_m.size()torch.Size([1, 512, 34, 34])x_l.size()torch..原创 2022-02-15 17:19:37 · 596 阅读 · 0 评论 -
YOLOv3网络结构
从GitHub - pythonlessons/TensorFlow-2.x-YOLOv3: YOLOv3 implementation in TensorFlow 2.3.1YOLOv3 implementation in TensorFlow 2.3.1. Contribute to pythonlessons/TensorFlow-2.x-YOLOv3 development by creating an account on GitHub.https://github.com/pythonlesso原创 2022-02-14 15:36:07 · 873 阅读 · 0 评论 -
ssd笔记
源码是https://github.com/aaalds/SSD-pytorchssd.pyfor layer in enumerate(vgg(base, 3)): print(layer)打印结果(0, Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1)))(1, ReLU(inplace=True))(2, Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1)...原创 2022-02-12 20:20:41 · 1759 阅读 · 0 评论 -
基于onnx的人脸识别
基本出发点是想做一个C++版本的人脸识别,而caffe的C++库,或mxnet的C++库等,暂时还不会编译,而之前基于onnxruntime 搞过一个项目,对这个库稍微了解一些,所以尽量采用onnx搞定全部功能核心的识别是基于https://github.com/onnx/models/blob/master/vision/body_analysis/arcfacehttps://github.com/onnx/models/blob/master/vision/body_analysis/arcfac原创 2021-12-12 20:48:10 · 3668 阅读 · 0 评论 -
opencv获取图像像素值的坑
根据https://stackoverflow.com/questions/46444474/c-ffmpeg-create-mp4-file修改原创 2021-10-13 14:55:09 · 859 阅读 · 0 评论 -
ffmpeg + opencv 把摄像头画面保存为mp4文件
ffmpeg 摄像头录像(Ubuntu)原创 2021-01-13 14:18:03 · 765 阅读 · 0 评论 -
ffmpeg + opencv 实现视频播放器(没有声音)
jianhua#include <inttypes.h>#include <math.h>#include <limits.h>#include <signal.h>#include <stdint.h>#include <sys/time.h>#ifdef __cplusplusextern "C" {#endif#include "libavutil/avstring.h"#include "libav原创 2021-01-11 15:31:54 · 8254 阅读 · 0 评论 -
opencv4 findChessboardCornersSB 棋盘格角点提取
opencv4 findChessboardCornersSB棋盘格角点提取简介 官方文档介绍 opencv4.1安装配置环境 findChessboardCornersSB提取棋盘格角点示例程序 简介用opencv相机标定一直不如matlab标定稳定和精度高。用opencv标定相机经常会发生棋盘格角点提取不到的现象,之前在做一个三维成像项目,需要比较高的成像精度,用opencv标定(findChessboardCorners+cornerSubPix)的效果根本达不到要求,.转载 2020-12-25 17:53:20 · 4776 阅读 · 6 评论 -
OpenCV 图片数字识别(C++)
下面是用C++来实现的该算法的过程与上述相同,但该算法只使用第一层次的等高线,因此算法只对每一个数字使用相同的外部轮廓。创建示例和标签数据的代码//Process image to extract contourMat thr,gray,con;Mat src=imread("digit.png",1);cvtColor(src,gray,CV_BGR2GRAY);threshold(gray,thr,200,255,THRESH_BINARY_INV); //Threshold to转载 2020-08-06 11:15:02 · 6181 阅读 · 1 评论 -
OpenCV Python 2 数字识别(K近邻)
我使用OpenCV中的KNeest或SVM特性来实现简单的文字识别OCR。下面是我实现的步骤,学习学习1)我的第一个问题是关于OpenCV示例附带的数据文件。我想知道文件里有什么。它包含一个字母,以及该字母的16个特征。和this SOF帮我找到了。本文对这16个特征进行了说明。使用Holland分类器进行字母识别2)如果不了解这些特性,就很难做。所以能实现就好,我没有太关注性能以下是我的训练数据图:(训练数据量较少。所有的字母都是相同的字体和大小)。我用OpenCV编.转载 2020-08-06 09:47:06 · 1438 阅读 · 0 评论 -
opencv4.0棋盘格标定c++
参考https://blog.youkuaiyun.com/u011574296/article/details/73823569修改#include <opencv2/opencv.hpp>#include <iostream>#include <fstream>#include <string>#include <vector>using namespace cv;using namespace std;void m_cali..原创 2020-05-14 11:54:02 · 2489 阅读 · 0 评论 -
keras 的 example 文件 conv_lstm.py 解析
该文件演示了ConvLSTM2D和Conv3D的使用,他的网络结构打印出来为_________________________________________________________________Layer (type) Output Shape Param # =========================...原创 2020-03-13 15:13:35 · 318 阅读 · 0 评论 -
mxnet中symbol的网络结构输出(参数维度,和每层输出维度)
这里介绍的是mxnet的symbol类的网络结构如果要打印参数维度的话,代码很简单,只需下面一行,即可生成一个pdf 文件,以图片形式展示出网络结构mx.viz.plot_network(sym, shape={"data":(1, 1, 32, 32)}).view()其中的(1, 1, 32, 32)是输入的维度,即shape,这里输入图片为单通道的32*32大小的图片,根据...原创 2019-05-06 11:04:13 · 4289 阅读 · 0 评论 -
dlib中的人脸识别原理
这里讨论的是人脸识别,不是人脸检测dlib中是先检测都人脸,然后把人脸通过Resnet生成一个128维的向量,Resnet有几种不同深度的结构原创 2018-12-18 18:10:08 · 23504 阅读 · 2 评论 -
Opencv4.0运行yolov3
代码我直接用的sample中的代码,用cmake编译一下即可OpenCV4.0的源码下载后,自带的sample文件:opencv-4.0.0/samples/dnn/object_detection.cpp或直接参看路径https://github.com/opencv/opencv/blob/master/samples/dnn/object_detection.cpp编译完成后...原创 2018-12-12 11:21:10 · 4459 阅读 · 4 评论 -
c++ opencv打开摄像头,1080P分辨率
#include <opencv2/opencv.hpp>#include <iostream>#include <time.h>using namespace cv;using namespace std; int main(){ VideoCapture capture(-1); capture.set(CV_CAP_PR...原创 2018-09-05 11:24:11 · 7363 阅读 · 2 评论 -
树莓派的Raspbian Stretch with desktop和Ubuntu Mate(废弃)
树莓派有自己发布的系统,名字也叫做Raspbian,而Ubuntu Mate有树莓派定制版,大家可根据自己的需求选择适合自己的版本对于我来讲,我还是希望各组件的版本可以高一点,而很可惜Raspbian 系统的版本相对偏低一些,如2019-04-08版本,其中的内核版本为4.14,更重要的是,我需要用到OpenCV,但软件仓库中的OpenCV版本为2.4,现在OpenCV已经发布4.1了...原创 2019-05-16 15:55:04 · 1106 阅读 · 0 评论 -
yolov3网络结构笔记
从yolo3_darknet53_coco(gluoncv/model_zoo/yolo/yolo3.py)调试获得,供参考-------------------------------------------------------------------------------- Layer (type) ...原创 2019-07-08 18:40:10 · 859 阅读 · 0 评论 -
mxnet 中的 DepthwiseConv2D API
在https://blog.youkuaiyun.com/zhqh100/article/details/90376732中介绍MobileNet时,提到DepthwiseConv2D,这是keras中的API,那mxnet中该 API 叫什么名字呢?我跟踪了一下代码,以及打印summary之类的,基本搞清楚了,mxnet 中无论是DepthwiseConv2D 还是Conv2D,统一都叫做C...原创 2019-06-27 18:07:39 · 707 阅读 · 5 评论 -
mask rcnn网络结构笔记
基于https://gluon-cv.mxnet.io/build/examples_instance/demo_mask_rcnn.html调试打印得到net.summary(x)-------------------------------------------------------------------------------- Layer (type) ...原创 2019-07-09 16:58:22 · 601 阅读 · 0 评论 -
理解YOLOv2训练过程中输出参数含义
转载自https://blog.youkuaiyun.com/dcrmg/article/details/78565440原英文地址:https://timebutt.github.io/static/understanding-yolov2-training-output/最近有人问起在YOLOv2训练过程中输出在终端的不同的参数分别代表什么含义,如何去理解这些参数?本篇文章中我将尝试着去回...转载 2019-07-14 11:33:35 · 267 阅读 · 0 评论 -
darknet53的网络结构笔记
供自己备忘本网络结构从gluoncv/model_zoo/yolo/darknet.py调试得到darknet layers = [1, 2, 8, 8, 4]darknet channels = [64, 128, 256, 512, 1024]--------------------------------------------------------------...原创 2019-07-05 15:29:03 · 37742 阅读 · 13 评论 -
基于VLC的rtsp服务器linux平台搭建
先说结论,搭建服务器命令cvlc -vvv v4l2:///dev/video0 --sout '#transcode{vcodec=h264,vb=200,acodec=none}:rtp{sdp=rtsp://:8554/}'客户端播放命令ffplay rtsp://127.0.0.1:8554/再说一些经历我是在NanoPC-T4平台上搭建的,我其实也不喜欢这个平台,...原创 2019-08-09 15:43:59 · 1125 阅读 · 0 评论 -
opencv3.2 在Ubuntu下的编译安装
网上也看到很多人写的编译方法,应该也都是可以的,只是不知道是否权威,我找到了官方的编译安装指导,原文链接为http://docs.opencv.org/trunk/d7/d9f/tutorial_linux_install.html如果英文比较好的话,建议直接参考该文档。下面是我的编译步骤:Ubuntu 17.04Opencv 3.2安装依赖包:sudo apt-g原创 2017-06-04 10:22:30 · 1423 阅读 · 0 评论