
计算机视觉
无比机智的永哥
看一遍,学一遍,不如动手写一遍。
Don't talk too much, show me the code.
展开
-
扩展卡尔曼滤波详解
Extened Kalman Filter简单介绍卡尔曼滤波详解讲解的基本的卡尔曼滤波算法是通过一个线性随机差分方程来估计当前状态,但是如果状态估计关系以及测量关系使非线性的怎么办,而且在实际使用中大部分的问题都是非线性的,所以提出了扩展卡尔曼滤波算法来解决非线性问题。基本模型扩展卡尔曼滤波算法和基本的线性卡尔曼滤波算法的基本模型在形式上很相近,也是包含状态方程和测量方程两个,只不过变量间的计算关系不是线性的。扩展卡尔曼滤波的状态方程,利用非线性随机差分方程(non-Linear Stochast原创 2020-11-15 18:12:26 · 17267 阅读 · 0 评论 -
边缘检测
Edge Detection简单介绍edge detection (边缘检测) 要检测出图像中的突然变化或者说是不连续情况。这样好处是:从边缘中可以获得图像的语义信息和形状信息;边缘信息比图像像素信息更紧凑;当然边缘肯定也会丢失相应的纹理信息,但是在某些不关心纹理的任务上比较合适,如果说最近比较火的无人车的车道检测。图像中边缘产生有几种原因如下:边缘检测输入是单通道图像(灰度图...原创 2019-03-20 19:25:07 · 914 阅读 · 0 评论 -
局部特征评价指标
整体评估检测评估描述符评估评价描述符 Descriptor 的可区分度,具体指在不同描述符距离阈值下的 Precision-Recall 曲线的 Area Under Curve (AUC),使用 NN 匹配策略。简单来说就是设置一个描述符距离阈值,两个描述符的距离小于该阈值认为二者是匹配上的,否则是非匹配上的,但小于该阈值的实际上有可能是匹配关系也有可能是非匹配关系。区分如下表:...原创 2019-02-25 19:56:50 · 1286 阅读 · 0 评论 -
Brown 数据集和评价指标
数据详情构建方法利用三维重建的方法获得特征点位置和匹配关系。数据内容Brown 总共包含三个数据集。###平均准则FPR95原文解释是:false positive rate (FPR) at true positive rate (positive recall) equal to 95%就是在 Brown 提供的测试集合上(一般是在 10w matches 上测试),95% 的...原创 2019-02-25 19:52:39 · 4468 阅读 · 3 评论 -
HPatches 数据集和评价指标
数据详情构建方法利用三维重建的方法获得特征点位置和匹配关系。数据内容后面更新###评价准则定义 y=(y1,…,yn)∈{−1,0,+1}n\mathbf { y } = \left( y _ { 1 } , \ldots , y _ { n } \right) \in \{ - 1,0 , + 1 \} ^ { n }y=(y1,…,yn)∈{−1,0,+1}n 是对查询 pat...原创 2019-02-25 19:50:32 · 5886 阅读 · 1 评论 -
SuperPoint 论文详解
SuperPoint简介SuperPoint是magic leap公司在18年的一篇工作,主要内容是输入一张灰度图,提取图上的特征点同时计算该点对应的描述符。作者提供了相应的代码,不过遗憾的是训练代码和相应的渲染的训练数据没提供,只有测试代码。流程整体框架整体框架如下图,下面会abc三个步骤分别介绍:特征点提取预训练如果要使用有监督的深度学习方案来解决该问题,不同于其他传统的像分类...原创 2019-02-17 21:23:39 · 32097 阅读 · 13 评论 -
LIFT 论文详解
LIFT本文提供了相应的theano 和 tensorflow,论文是比较早期的探索利用CNN的方法去学习特征的工作,而且该组是瑞士联邦理工学院的 cvlab,之前也做过很多 deep feature 和 三维视觉相关的研究,该工作很值得研究一下。主要思路本文利用CNN网络特征点提取,ori 估计和特征描述符的计算,而且是在统一模型框架里面学习这三个子任务。基本流程整体 pipeline...原创 2019-02-16 23:55:22 · 9407 阅读 · 3 评论 -
HardNet 论文详解
HardNet本文提供了相应的代码,是基于 pytorch。主要思路本文主要是提出了新的 loss 用于特征 metric 的学习。提出的 loss 可以最大化一个 training batch 中最近的正负样本之间的距离,而且对浅层以及深层的 CNN 网络都有作用。本文基于之前的 L2-Net 工作,把 loss 更换成本文提出的 loss,这里叫做 HardNet。基本流程采样和 l...原创 2019-01-29 20:50:39 · 14302 阅读 · 1 评论 -
L2-Net 论文详解
L2-Net本文提供了相应的代码,是基于 matconvnet,论文的思路相对来说比较简单,可以使用 pytorch 或者 tersorflow 等框架复现。主要思路之前有 SIFT 等手工设计的 patch 特征,这里提出的 L2-Net 的方法,利用 CNN 方法在 Euclidean 空间学习 patch 特征。本文主要的工作包括:提出递进的采样策略,可以保证网络在很少的 epoc...原创 2019-01-28 20:27:40 · 9248 阅读 · 2 评论 -
GeoDesc 论文详解
GeoDesc主要思路目前使用CNN网络来学习局部特征在 patch-based 的数据基准上取得了很大的进展,但是应用到具体的 3D 重建等工作上效果还是不如传统的特征,如 SIFR、SURF、ORB 等。所以本文提出了一种新型的局部特征的学习方法 GeoDesc,主要是从多视图重建中学习到几何的约束信息。实验证明本文提出的方法效果在大量的基准集上取得了很好的效果,而且对于重建任务也很适用。...原创 2019-01-23 20:42:59 · 3089 阅读 · 0 评论 -
基于深度学习的图像局部特征
基于学习方式的特征基于学习方式的特征简介对比细节SuperPoint简介流程提取特征点计算描述符备注评价特征点描述符(这里主要是记录一下自己看论文的思路和过程,目前时间不是很充足,有些写到一半,后面有时间会继续更新)基于学习方式的特征简介传统的特征提取和特征描述方式,比如SIFT、SURF和ORB等,需要人工去手动提取特征点,然后设计特征描述符。目前随着深度学习的发展,越来越多的工作尝试使...原创 2019-02-17 21:23:25 · 5083 阅读 · 0 评论 -
相机标定(Camera calibration)
简介摄像机标定(Camera calibration)简单来说是从世界坐标系换到图像坐标系的过程,也就是求最终的投影矩阵 PP 的过程,下面相关的部分主要参考UIUC的计算机视觉的课件(网址Spring 2016 CS543 / ECE549 Computer vision)。基本的坐标系:世界坐标系(world coordinate system);相机坐标系(camera coordina原创 2016-03-30 16:46:20 · 85274 阅读 · 31 评论