
Computer Vision
文章平均质量分 96
FesianXu
腾讯-微信事业群-高级算法工程师, 百度-搜索策略部-前高级算法工程师。 主要从事多模态检索、视频检索、信息检索,大模型落地应用等领域工作。
展开
-
【论文极速读】VQ-VAE:一种稀疏表征学习方法
VQ-VAE进行视觉稀疏化原创 2023-02-26 10:57:58 · 1096 阅读 · 0 评论 -
中心投影中透视的形成
中心投影中透视的形成 FesianXu at Baidu search team 20210625我们知道在透视法中,相互平行的平行线会在无限远处相交于一点,我们称之为理想点(ideal point),对于这个透视成像的介绍,我们在之前的文章[1,2,3]中都或多或少介绍过,同时还引入了齐次坐标系,以便于对投影变换下的不同情况进行统一建模。从直观上看,平行线在无限远处相交于一点的现象如Fig 1所示。透视现象也在工程制图,美术中有着诸多应用,如Fig 2所示。 ...原创 2021-06-26 09:54:18 · 1041 阅读 · 0 评论 -
运动的零阶分解与一阶分解以及在图片动画化中的应用 I
运动的零阶分解与一阶分解以及在图片动画化中的应用 I(The 0th-order and first-order decomposition of motion and the application in image animation I) FesianXu 2020/09/16 at UESTC前言最近基于AI的换脸应用非常的火爆,同时也引起了新一轮的网络伦理大讨论。如果光从技术的角度看,对于视频中的人体动作信息,通常可以通过泰勒展开分解成零阶运动信息与一阶运动信息,如文献...原创 2020-09-21 15:12:11 · 1880 阅读 · 5 评论 -
从手写字符匹配开始,简要解释局部仿射变换(local affine transformation)
从手写字符匹配开始,简要解释局部仿射变换(local affine transformation) FesianXu 2020/09/07 at UESTC前言最近笔者看论文[1]的时候发现有个术语local affine transformation,也就是所谓的局部仿射变换,仿射变换笔者之前有过研究[2],还算是比较清楚,但是谈到什么是“局部”仿射变换,就没有头绪了。后面笔者查找资料[3]后,终于有所了解,因此简要笔记与此,希望对大家有所帮助。如有谬误,请联系指出,转载请联系...原创 2020-09-07 19:29:22 · 1632 阅读 · 0 评论 -
基于匹配点集对单应性矩阵进行估计
基于匹配点集对单应性矩阵进行估计 2020/4/28 FesianXu前言在立体视觉中,对单应性矩阵进行估计是一个很重要的任务,我们在之前的博文[1,2,3]中的讨论中都或多或少地涉及到了单应性矩阵,我们知道它是在投影变换中保持共线性的一种性质。在本文中,我们将讨论如何通过匹配点的关系,对单应性矩阵进行估计。如有谬误,请联系指出,转载请联系作者并注明出处,谢谢。注:本...原创 2020-05-04 11:42:48 · 2009 阅读 · 2 评论 -
万字长文漫谈视频理解
漫谈视频理解 2020/4/12 FesianXu前言AI算法已经渗入到了我们生活的方方面面,无论是购物推荐,广告推送,搜索引擎还是多媒体影音娱乐,都有AI算法的影子。作为多媒体中重要的信息载体,视频的地位可以说是数一数二的,然而目前对于AI算法在视频上的应用还不够成熟,理解视频内容仍然是一个重要的问题亟待解决攻克。本文对视频理解进行一些讨论,虽然只是笔者对互联网的一些...原创 2020-04-16 09:37:52 · 7437 阅读 · 13 评论 -
【多视角立体视觉系列】 几何变换的层次——投影变换,仿射变换,度量变换和欧几里德变换
【多视角立体视觉系列】 几何变换的层次——投影变换,仿射变换,度量变换和欧几里德变换 20200226 FesianXu前言几何变换非常常见,在计算机视觉和图形学上更是如此,而这里指的几何一般是由点,线,面等几何元素组成的1,2维或3维图形。几何变换能够实现不同空间几何元素的对应,在很多领域中有着非常多的应用,立体视觉便是其中一个。本文尝试对四种不同类型的几何变换进行...原创 2020-02-27 12:04:47 · 3645 阅读 · 1 评论 -
论相机中心投影中,相机中心的作用
论相机中心投影中,相机中心的作用 2019/12/3 FesianXu前言在中心投影中,相机中心作为聚集光线的理想中心,其具有核心的作用,本文参考[1]中的讨论,加上一些见解,作为笔者学习过程中的笔记。如有谬误,请联系指正。转载请注明出处。∇\nabla∇ 联系方式:e-mail: FesianXu@gmail.comQQ: 973926198github: ...原创 2019-12-03 16:06:18 · 1154 阅读 · 0 评论 -
投影相机,透视相机,弱透视相机和仿射相机的区别和联系
投影相机,透视相机,弱透视相机和仿射相机的区别和联系 2019.11.03 FesianXu前言相机一般来说是一种从3D到2D的一种投影工具,其按照数学模型可以分为投影相机,透视相机,弱透视相机和仿射相机等,笔者在本文中尝试对其进行区分和联系。如有谬误,请联系指正。转载请注明出处。∇\nabla∇ 联系方式:e-mail: FesianXu@gmail.comQ...原创 2019-11-03 15:52:46 · 10261 阅读 · 2 评论 -
讨论物体的表面深度对相机成像的影响
讨论物体的表面深度对相机成像的影响 2019.11.02 FesianXu前言对于不同的物体来说,其表面纹理,或者凸出凹陷各有不同,这些对于相机成像而言都会造成影响,笔者在这篇博文中尝试对此进行讨论。如有谬误,请联系指正。转载请注明出处。∇\nabla∇ 联系方式:e-mail: FesianXu@gmail.comQQ: 973926198github: h...原创 2019-11-02 11:29:25 · 779 阅读 · 0 评论 -
图像校正(Image Rectification)——使得在对极线上寻找对应点更加容易
图像校正——使得在对极线上寻找对应点更加容易 2019/10/27 FesianXu文章目录@[toc]前言为什么我们需要图像矫正图像矫正Reference前言我们在[1]中曾经谈到了如何在对极线上去寻找对应点,这样会使得算法更鲁棒,而且速度更快。在本文中,我们将会继续介绍一种称之为图像矫正的方法,通过这种方法,我们可以在对极线的基础上,使得寻找对应点变得更为容易。...原创 2019-10-28 09:44:00 · 13460 阅读 · 2 评论 -
几何变换——关于透视变换和仿射变换以及齐次坐标系的讨论
几何变换——关于透视变换和仿射变换以及齐次坐标系的讨论 2019/10/26 FesianXu前言在本文首先介绍了引入齐次坐标系的必要性,随后介绍了在几何变换中常见的投射变换和仿射变换,这俩种变换在计算机视觉问题中,包括在相机成像过程中都是很基础并且重要的内容。如有谬误,请联系指正。转载请注明出处。∇\nabla∇ 联系方式:e-mail: FesianXu@gm...原创 2019-10-26 14:51:30 · 2813 阅读 · 6 评论 -
《临时笔记》 一些计算机视觉的英语术语的纪录
有些计算机视觉相关的英语文献上,有些术语在中文社区中比较少翻译,这里汇总下,作为笔记。low-relief典故是意大利语的basso rilievo,意思即是 ‘浅浮雕’ 之意,这里的relief有深度的意思,不过这个深度似乎指的是物体本身凸出的,或者凹陷的意思,是物体本身的属性,而不是我们理解的那种物体A离物体B之间的深度。Fig 1. 硬币和浮雕属于可以用relief描述深度的...原创 2019-10-25 11:32:13 · 1143 阅读 · 0 评论 -
相机中的透视投影几何——讨论相机中的正交投影,弱透视投影以及透视的一些性质
相机中的透视投影几何——讨论相机中的正交投影,弱透视投影以及透视的一些性质 2019/10/22 FesianXu文章目录@[toc]前言相机的针孔模型透视投影的方程透视投影的若干性质焦距的若干影响正交透视投影和弱透视投影Reference前言相机中的成像其本质是从3D实体世界中的物体投影到2D成像平面上,在这个过程中存在着许多投影相关的内容,本文讨论了一些透视投影的...原创 2019-10-23 11:50:58 · 7126 阅读 · 0 评论 -
立体视觉中的对极几何——如何更好更快地寻找对应点
立体视觉中的对极几何——如何更好更快地寻找对应点 2019.10.21 FesianXu文章目录@[toc]前言什么是立体视觉对极几何对极约束本征矩阵去掉归一化坐标系的限制,引入基础矩阵Reference前言在立体视觉中,我们通过多个摄像机的相互配合,可以获得关于现实生活中物体的一些3D信息,通过这些信息,我们可以对这个物体进行重建,建模等等。而在立体视觉中,对极几何...原创 2019-10-21 16:08:24 · 2720 阅读 · 8 评论 -
相机的针孔模型及其内参数,外参数的理解
相机的针孔模型及其内参数,外参数的理解 2019.10.18 FesianXu文章目录@[toc]前言相机的针孔模型坐标系的改变考虑更多因素总结Reference前言在相机校准中,我们经常会提到内参数,外参数,这些参数决定了一个相机的成像的效果,是后续一系列计算机视觉问题的基础中的基础,然而因为较为底层的原因,现在却比较少人关心它,笔者最近在学习底层的计算机视觉理论,...原创 2019-10-18 22:22:38 · 3602 阅读 · 14 评论 -
《土豆学Object Detection》 之 RCNN初探
《土豆学Object Detection》 之 RCNN初探前言本土豆最近在做Human-Object Interaction(HOI)任务的研究,其中有用到物体识别的模块,因此也打算趁此机会把Object Detection(OD)的拿来系统学习下,并且在此纪录下笔记。土豆我深知OD已经在网络上有着很多中文博客资料了,但是个人觉得很多都不够详细,不够入门级,因此我尽量在此博客里面...原创 2019-08-01 13:54:12 · 425 阅读 · 0 评论 -
深度学习debug沉思录第二集
前言在之前文章[1]中,我们曾经讨论过在深度学习实践过程中可能遇到的一些bug或者问题,总共讨论了20个问题。在本文中,我们将继续讨论与深度学习有关的bug和问题,其中很多是关于一些超参数的实践中的调优问题。本文将持续更新。需要强调的是,本文的很多单纯只是经验,在尽可能列出参考文献的同时却并无严格理论验证,希望大家见谅。欢迎大家集思广益,共同维护这个经验集,为整个社区贡献微弱力量。文章目录前言...原创 2019-02-15 11:48:58 · 1030 阅读 · 1 评论