Computer Vision
Serrie.
心存敬畏
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于深度学习的OCR大致过程总结(基于吴恩达机器学习课程笔记)
OCR(optical character recognizer)一个简单的ocr系统可大致分为三步:1.Text detection 2.Character segmentation 3.Character classification如:复杂一些的ocr系统带有第四步 即spelling correct system如当第三步将clean...原创 2019-05-06 13:33:31 · 2064 阅读 · 0 评论 -
RCNN、Fast-RCNN Faster-RCNN大致区别总结
RCNN大致步骤:先提取proposal,然后将proposal输入CNN提取特征,使用SVM分类,最后做bbox reg。缺点:速度。提取proposal的时候计算机进行大量重复计算Fast改进:ROI pooling在fast中,作者将输入变为一整张图片,通过ROI再进行特征选择。并且将bbox reg和区域分类都加入网络变成了multi...原创 2019-05-09 09:21:25 · 7621 阅读 · 1 评论 -
yolo + yolov2 + yolov3 随笔总结(差异、相同、改进)
博客为随笔笔记类,便于加深理解以及比较各模型不同。若想要系统学习yolo系列,建议阅读论文或详解博客PS:!!!!yolo的bounding box和ssd的anchor box不一样!!!他不是在图中每一个坐标点生成了一系列的盒子,这个盒子我们把它叫做Anchor,也就是先验盒子!!yolo,没有先验的概念,而是将图片分成了一系列的格子!! 而这个格子直接预测到的目标的定位的框就...原创 2019-05-07 09:33:14 · 5832 阅读 · 2 评论 -
C++使用fread读取yuv一帧并写入新的yuv
#include<iostream>#include <stdio.h>#include <stdlib.h>#include "math.h"#include "memory.h"using namespace std;int main(){ FILE *in, *out; //char data[100000]; ...原创 2019-07-05 15:37:26 · 6049 阅读 · 5 评论 -
opencv读取图像时图像数组的存储方式,以及如何访问每一个点的像素
使用opencv读取图像时图像的排列方式是一个三维数组,但并非是三维数组按照[r:[[]] g:[[]] b:[[]]] 然后组合的方式存储。图片的存储方式可以理解成有个长 * 宽 的矩阵 矩阵的每一个点包括[b, g, r]三个点的数据 是按照[b, g, r][b, g, r] 的方式存储#include <iostream>#include <opencv...原创 2019-07-11 11:40:39 · 4659 阅读 · 0 评论 -
CV方向面试经验技术路线总结
CV方向:(object detection, semantic segmentation,人脸,姿态,视觉重建,图像恢复生成(gan),识别分类等)面试经验总结:对自己项目的每个细节都了解清楚,多总结面试对基本知识点的掌握要清晰,不能模棱两可对算法公式的掌握要细致,防止推公式。需要准备的:论文,实习经历,项目(硬实力) 。软实力就不说了,问啥都得会是最好...原创 2019-08-15 11:35:46 · 1294 阅读 · 0 评论 -
NMS的一种实现方法(带详细注释)
# -*- coding:utf-8 -*-import numpy as npdef py_cpu_nms(dets, thresh): """ :param dets:N*M 二维数组, N是BBOX的个数, M的前四位对应的是(x1, y1, x2, y2) 第5位是对应的分数 x y为坐标 :param thresh:0.3 0.5.... :re...原创 2019-08-15 11:38:11 · 797 阅读 · 0 评论
分享