
AR/VR_3D
文章平均质量分 92
wishchin
CV算法工程师:从事室内场景感知方面工作,完成算法实验和软件开发。
展开
-
3D 高斯泼溅(Gaussian Splatting)-3D重建的3DGS时代
3D重建自从NeRfs出现之后又热闹了一次,3D GS技术一时间燃变了整个三维重建和Slam领域,几个月不见,沧海桑田。3D 高斯泼溅(Splatting)是,它允许实时渲染从小图像样本中学习到的逼真场景。从点云/多面体 到场景渲染,是一个异常 经验性的过程。SIGGRAPH 2023论文奖公布,山大、港大获奖,北大、腾讯光子获提名 - 知乎机器之心报道, 编辑:蛋酱、小舟。近日,计算机图形学及互交技术顶会 SIGGRAPH 2023 公布了今年的技术论文奖项。原创 2024-05-17 09:41:49 · 3875 阅读 · 0 评论 -
Windows10使用OrbSlam3-VS2017-VC12版本
OrbSlam3集成了IMU信息,可用以VIO融合重建。参考这哥们的地址,依据GitHub上的介绍git clone --recursive 之后编译即可ORBSLAM3 Win10 VS2017 配置简明指南_滥觞LanShang的博客-优快云博客_orbslam3 windowsGit地址:GitHub - chanho-code/ORB-SLAM3forWindows: ORB-SLAM3 for Windows Platform编译过程:1.使用sourcetree git下载原创 2022-04-02 18:25:52 · 1340 阅读 · 0 评论 -
三维重建13X-2:FCN和MaskRCNN中Mask的获取
在添加检测的三维重建中,获取连续性图片区域是一个提高三维重建效果的重要方法。不管在稠密重建和稀疏重建,对特定的目标区域添加UV图,并可以对特定区域内的稀疏或者稠密点云深度进行优化。当然,使用较为传统的方法,作为一个耗时的工程,通过激光器扫描的稠密表面点云,然后经过图片传统经验方法进行分割贴图,是一个效果更好的方法。但在此不做讨论,只讨论使用单一方法提高三维重建的 可视化效果。FCN-DeepLab中的MASK获得严格地说,FCN系列目的并非形成Mask,而是基于分割的思路,而Mask是基于目标检原创 2020-11-06 16:08:18 · 618 阅读 · 0 评论 -
RGB_D_开发征程(使用Kinect)
学习历程依此为纲!Kinect到手快一个月了,期间查阅了很多资料,见识了很多牛人,他们的工作如此漂亮,让我大开眼界。现将自己所掌握的资料汇总于此,以便随时查阅。原创 2013-08-20 09:19:49 · 1540 阅读 · 0 评论 -
RPNet++:人脸对齐faceAlignment和基于CNN的三维人脸恢复
参考,人脸pose检测算法:https://blog.youkuaiyun.com/wishchin/article/details/51554036。 人脸的Pose检测需要一个 SolvePNP 的过程,对于固定三维点集模型,找出二维点集对应的位姿。此外,在track时使用点集寻找一个最优的位姿起始,应该给出一个好的起始点。或者,人脸pose检测只需要人脸对齐,同时找到二维人脸的平面即可。 参考总结:https://www.jianshu.com/p/e4b9317a...转载 2020-09-17 10:57:23 · 1122 阅读 · 2 评论 -
三维重建5:场景中语义分析/语义SLAM/DCNN-大尺度SLAM
前言: 在实时/非实时大规模三维场景重建中,引入了语义SLAM这个概念,参考三维重建:SLAM的尺度和方法论问题和三维重建:SLAM的粒度和工程化问题 。大规模三维场景重建的尺度增大,因此相对于整个重建过程的粒度也从点到特征点到目标物体级别,对场景进行语义标记成为重要的工作。场景语义标记的传统方法: 其他:机器人在线场景感知问题,场景识别问题。...原创 2019-06-17 14:41:00 · 9076 阅读 · 0 评论 -
三维重建:点绕特定轴旋转公式
一些特定的三维平面运算可以直接在三维空间中进行,也可以在二维平面中运行,通过坐标变化转换到三维空间。旋转方式有中心旋转、轴旋转。1. 罗德里格旋转公式 在三维旋转理论体系中,罗德里格旋转公式(根据欧林·罗德里格命名)是在给定转轴和旋转角度后,旋转一个向量的有效算法。如果v是在中的向量,k是转轴的单位向量,θ是旋转角度(根据叉乘的方向确定正负号),那罗德里格旋转公式表达为:输入:V ...转载 2018-07-05 14:22:09 · 19463 阅读 · 0 评论 -
CNN结构:场景分割与Relation Network
参考第一个回答:如何评价DeepMind最新提出的RelationNetWork 参考链接:Relation Network笔记 ,暂时还没有应用到场景中 LiFeifei阿姨的课程:CV与ML课程在线论文:A simple neural network module for relational reasoninggithub代码...转载 2018-03-23 14:11:58 · 4745 阅读 · 0 评论 -
三维CNN:收集一些最近的3d卷积网络PointNet++
受限于点云本身的无序性,不同设备在不同位置扫描物体所获得的数据不尽相同,数据难以通过端到端方法来处理;点云本身也面临数据缺失的问题,比如被扫描模型往往会被遮挡。 针对无序点云数据的深度学习方法研究,目前进展还相对缓慢。在 CVPR 2017 上,斯坦福大学提出的 PointNet 是第一种直接处理无序点云数据的深度神经网络。团队通过在每个点训练一个 MLP,把每个点投...原创 2018-03-22 18:04:48 · 10185 阅读 · 1 评论 -
相机标定:PNP基于单应面解决多点透视问题
利用二维视野内的图像,求出三维图像在场景中的位姿,这是一个三维透视投影的反向求解问题。常用方法是PNP方法,需要已知三维点集的原始模型。 本文做了大量修改,如有不适,请移步原文: 文章:张正友相机标定&OpenCV实现&程序评价&矫正流程解析 文章:相机标定原理介绍----相机标定---相机模型 根据光学成像的基本原理,原创 2016-05-18 19:18:51 · 5130 阅读 · 0 评论 -
PCL: Delaunay三角剖分(关于三维实体分块思想总结)
引言:实体造型 里面讲述的都是相对全局的方法介绍,主要应用于特定领域,在特定领域能达到相当好的结果;一:关于模型细分化 及其运算(转自于百科)目前常用的实体表示方法主要有:边界表示法(BRep)、构造实体几何法(CSG)和扫描法。(1) 三维形体在计算机内的常用表示法 对于三维几何元素或简称三维形体,最常用的表示法有两种:CSG和BRep。 ① CS原创 2016-05-18 19:24:57 · 7480 阅读 · 0 评论 -
Eigen库对齐问题:declspec(align('16')) 的形参将不被对齐
添加 修改为 869行为引用之后,引发2562行的错误,修改方式为 把第二个参数0去掉。原创 2013-10-20 14:32:00 · 7651 阅读 · 2 评论 -
三维卷积:全景图像Spherical CNNs(Code)
卷积神经网络(CNN)可以很好的处理二维平面图像的问题。然而,对球面图像进行处理需求日益增加。例如,对无人机、机器人、自动驾驶汽车、分子回归问题、全球天气和气候模型的全方位视觉处理问题。 将球形信号的平面投影作为卷积神经网络的输入的这种Too Naive做法是注定要失败的,Cnns的巨大成就来源于局部感受野的权值共享,而对于球形图像,若要使用CNNs直接共享,构建...翻译 2018-06-04 11:47:54 · 10135 阅读 · 0 评论 -
个人技术博客的选择:优快云、博客园、简书、知乎专栏还是Github Page?
文章链接:个人技术博客的选择:优快云、博客园、简书、知乎专栏还是Github Page? 感觉还是Fuck The Dog!看来还是以后把文章写在本地,然后再上传到优快云吧。被优快云的缓存机制坑了几次,得非常注意这次事件才行!!!...转载 2018-06-19 17:21:50 · 4813 阅读 · 0 评论 -
VR: AR和VR演进哲学
Facebook 20亿美元(4亿美元+16亿美元股票换购方式)收购虚拟现实厂商Oculus 引爆AR产业,索尼不温不火逐步演进的头盔项目也该加速了。最近Oculus rift发布了商业版本:Oculus rift发布,体感游戏引入现实,AR游戏看似在15年的E3展会上变得火爆,热闹之后还有很长的路要走。 看看我们需要什么样的游戏? 黑白斯方块也可以让人不亦乐乎原创 2015-06-18 09:18:09 · 1087 阅读 · 0 评论 -
Learning Less is More – 6D Camera Localization via 3D Surface Regression
在Python满天飞, tensorflow横行的DL界, 遇到好久不见的开源C++ Project简直是一股清流...................Proj:https://hci.iwr.uni-heidelberg.de/vislearn/research/scene-understanding/pose-estimation/Git:https://github.com/visl...转载 2019-05-09 12:02:33 · 1426 阅读 · 0 评论 -
三维重建:深度传感技术的中外差异
原始文章:https://www.eetimes.com/document.asp?doc_id=1333597中文翻译:https://www.ednchina.com/news/201808221344.html本文只有几条简介,请拜访原文...3D传感技术在智能手机用户中很流行吗?它会是未来每一支智能手机的必备功能吗?手机的发展推动了3D相机的发展应用,而不是工业应用,也算是另一...转载 2018-11-09 15:33:56 · 1069 阅读 · 0 评论 -
三维重建:三维空间中平面的旋转公式
参考:三维重建3:旋转矩阵-病态矩阵、欧拉角-万向锁、四元数---问题描述: 三维空间内,给定一个多边形平面,得出旋转到任一平面的方法步骤。问题分析: 每一个平面方向可以由法线唯一确定,空间平面可以通过一旋转r(x)和平移t(x)到达任一平面。因此平面的旋转可以映射为直线的旋转。解决步骤: 1.得到平面的法线方程; ...原创 2018-07-18 16:23:08 · 22784 阅读 · 5 评论 -
3D特征:关于HFM和HBB
前景假设和包围盒,哈哈哈! (1): 要用到HBB,定义还不太清楚,来自于 VALVE Developer Community (https://developer.valvesoftware.com/wiki/Bounding_box)的 解释原创 2013-09-10 09:44:06 · 1073 阅读 · 0 评论 -
ICCV2015上的GazeTracker论文总结
SLAM问题先慢慢编译一段时间,赶紧拾起来GazeTrack的事情...... ICCV2015的大部分paper已经可以下载,文章列表在这个位置、 http://www.cvpapers.com/iccv2015.html 文章题目关于Gaze的论文有 Rendering of Eyes for Eye-Shape Regis原创 2016-03-24 13:45:01 · 3470 阅读 · 1 评论 -
PCL:描述三维离散点的ROPS特征(Code)
前言: 三维点云为三维欧式空间点的集合。对点云的形状描述若使用局部特征,则可分为两种:固定世界坐标系的局部描述和寻找局部主方向的局部描述,ROPS特征为寻找局部主方向的特征描述。1.寻找主方向(对XYZ轴经过特定旋转)LFR: <1>.计算法线特征:这一步是非常耗计算量的,若达到可以接受的法线精度,此过程几乎占据了 整个计算过程的50%;可选择的...翻译 2016-05-18 19:13:06 · 3044 阅读 · 20 评论 -
Morse理论:拓扑不变性特征匹配原理
微分拓扑的一个重要分支。通常是指两部分内容:一部分是微分流形上可微函数的莫尔斯理论,即临界点理论;另一部分是变分问题的莫尔斯理论,即大范围变分法。转载 2016-12-21 13:26:11 · 3515 阅读 · 0 评论 -
veket智能机器人
veket儿童操作系统希望工具超过小puppy linux系统一个还在发展中的linux系统:原创 2016-05-18 19:10:56 · 930 阅读 · 0 评论 -
PCL: 根据几何规则的曲面剖分-贪婪法表面重建三角网格
点云场景中进行物体识别,使用全局特征的方法严重依赖于点云分割,难以适应杂乱场景。使用局部特征,即对点云进行提取类似于3D SURF、ROPS之类的局部特征,需要寻找离散点云块的局部显著性。 点云的基本局部显著性有某一点处的曲率。一、几何尺寸 可表述为显著性曲率的曲率阈值与物体的几何大小有关。 ...原创 2016-06-30 11:02:02 · 3575 阅读 · 0 评论 -
Eigen与Matlab语法及语义辞典
Eigen为Matlab转换为C++提供了一个简单的语法级别的代码迁移工具. 对一些代码进行了扩充,以便程序由Matlab到Eigen的移植...................参考链接:http://eigen.tuxfamily.org/dox/AsciiQuickReference.txt// A simple quickref for Eigen. Add转载 2015-07-07 17:50:10 · 1092 阅读 · 0 评论 -
Matlab移植到Eigen用到的词条
同型矩阵运算满足加法交换律、结合律;并存在单位元、逆元、和0元,为同型矩阵对加法的交换环。 Eigen的简单运算参考:http://blog.163.com/jiaqiang_wang/blog/static/1188961532013625102721873/原创 2015-07-07 17:49:13 · 3516 阅读 · 0 评论 -
点云处理软件Pointscene
转载于PCL中国:点云处理软件Pointscene 软件官网:https://pointscene.com/笔者评: Pointscene是目前的点云处理软件之一,其主要是操作简单直观,并且支持与WebGL兼容的格式导出。Have you ever wanted to share a point cloud with a customer or coll转载 2015-09-02 18:27:31 · 4289 阅读 · 1 评论 -
SLAM: Orb_SLAM中的ORB特征
ORB是是ORiented Brief 的简称。ORB的描述在下面文章中:Ethan Rublee and Vincent Rabaud and Kurt Konolige and Gary Bradski,ORB: an efficient alternative to SIFT or SURF, ICCV 2011没有加上链接是因为作者确实还没有放出论文,不过OpenCV2.3RC中已经有了实现,WillowGarage有一个talk也提到了这个算法,因此我不揣浅陋,在这里总结一下。转载 2015-12-03 15:45:00 · 5443 阅读 · 1 评论 -
三维重建:深度相机方案对比-KinectFusion的基本原理(尺度)
KinectFusion算法原理依据2011年发表的Fusion重建的论文,主要重建方法为TSDF算法,并在GitHub上开源了相关代码,可以直接编译使用。 论文:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/kinectfusion-uist-comp.pdf;...原创 2014-12-27 16:04:19 · 7185 阅读 · 1 评论 -
三维重建:***三维模型的网格细化
顶点分裂和面分裂,其区别主要在于所作用的基本几何体元。顶点分裂是对于给定度为n的顶点i(顶点的度表示顶点所关联的边的个数),将其分裂成n个新顶点,每个顶点对应着它的一个邻面,使用该方式的细分方法称为对偶型经常使用的三种面分裂细分模式主要有三种:Loop细分模式,Butterfly细分模式,√3细分模式,这三种方法的主要区别即在于它们的细分规则不同。转载 2016-06-30 10:40:03 · 4184 阅读 · 1 评论 -
三维重建:SLAM的尺度和方法论问题
百度百科的定义。此文引用了其他博客的一些图像,如有侵权,邮件联系删除。作为算法的SLAM,被称为同步相机位姿确定和地图构建。作为一个工程的SLAM,有众多的算法。 在计算机视觉中, 三维重建是指根据单视图或者多视图的图像重建三维信息的过程. 由于单视频的信息不完全,因此三维重建需要利用经验知识.。而多视图的三维重建(类似人的双目定位)相对比较容易, 其方法是先对摄...原创 2019-04-14 12:09:28 · 14392 阅读 · 5 评论 -
安卓手机使用前置摄像头
原文链接: 安卓调用前后摄像机以及代码实现 主要代码在这里:使用null表示后置摄像机,camera2表示前置摄像机.....转载 2017-07-31 19:07:13 · 3108 阅读 · 0 评论 -
SLAM: SLAM的发展历程(WIKI)
参考维基百科: https://en.wikipedia.org/wiki/Simultaneous_localization_and_mapping 你们叫他SLAM,我还是习惯叫他三维重建......当夏日的中午,你看到一只鸟儿飞在丛林中,鸟儿偶尔被树叶遮挡,时隐时现,但你总能估计出鸟儿下一时刻大致的位置。在很多时刻,人脑潜意识下使用了滤波,概率密度估计的最大...翻译 2015-10-26 12:21:10 · 12792 阅读 · 0 评论 -
SLAM: Orb_SLAM的使用小综述
Orb_SLAM被业内人士称为第一个现代SLAM方法,不仅是因为其工程化良好,简单易用。OrbSLAM更是对PTAM的改进,PTAM分离了追踪和地图构建过程。OrbSLAM走的更远,把闭环检测和世界地图的优化从局部地图优化中独立出来,另辟一个线程,使在线SLAM过程应用到了更大的场景中。 作为传统在线SLAM算法的滤波器算法,使用EM同时完成追踪和地图构建;PTA...原创 2015-12-03 15:59:58 · 8923 阅读 · 2 评论 -
三维重建:SFM中BA的并行化
SFM,运动中结构重建。SFM是一种离线重建方法,SFM未得到原始数据中的帧间关系,因此在前期处理与SLAM有所不同。SLAM方法依据视觉里程算法,构建状态数据序列即图结构,仅需要解决累计误差问题。而SFM需要使用匹配和优化方法,重建数据的图结构,需要优化方法,SFM过程比SLAM过程更加复杂。 BA:光束平差法,利用非线性最小二乘法求取相机位姿,三维点坐标。Bun...转载 2017-03-30 10:25:31 · 3324 阅读 · 2 评论 -
三维重建:SLAM算法的考题总结
参考英文维基:https://en.wikipedia.org/wiki/Slam 。参考文档:视觉slam研究分析的一点认识一、四大简述1、请简单描述您对机器人的SLAM的概念理解?答: 机器人需要在自身位置不确定的条件下,在完全未知环境中创建地图, 同时利用地图进行自主定位和导航。这就是移动机器人的同时定位与地图创建(simultaneous localizatio...原创 2016-05-16 17:26:35 · 9100 阅读 · 4 评论 -
三维重建:SLAM的粒度和工程化问题
百度百科的定义。此文引用了其他博客的一些图像,如有侵权,邮件联系删除。 SLAM不是一个单一算法,是个工程。在计算机视觉中, 三维重建是指根据单视图或者多视图的图像重建三维信息的过程. 由于单视频的信息不完全,因此三维重建需要利用经验知识.。而多视图的三维重建(类似人的双目定位)相对比较容易, 其方法是先对摄像机进行标定, 即计算出摄像机的图象坐标系与世界坐标系的...原创 2019-04-14 11:33:47 · 6578 阅读 · 1 评论 -
三维重建3:旋转矩阵-病态矩阵、欧拉角-万向锁、四元数
摘抄部分有意思的链接,如有不适,请移步原文。 参考知乎上的文章链接:如何形象地理解四元数? ;一个详尽的可作为教程的翻译:理解四元数的中文翻译... ; 英文原文:http://www.3dgep.com/understanding-quaternions/。建议详细阅读。 传说 四元数由汉密尔顿发明,这一发明起源于十九世纪的某一天...转载 2017-06-19 15:09:11 · 3767 阅读 · 1 评论 -
AR应用简介初始
一个AR系统需要有显示技术、跟踪和定位技术、界面和可视化技术、标定技术构成。跟踪和定位技术与标定技术共同完成对位置与方位的检测,并将数据报告给AR系统,实现被跟踪对象在真实世界里的坐标与虚拟世界中的坐标统一,达到让虚拟物体与用户环境无缝结合的目标。为了生成准确定位,AR系统需要进行大量的标定,测量值包括摄像机参数、视域范围、传感器的偏移、对象定位以及变形等。相对与智能手机而言,AR就是根据转载 2013-11-25 21:55:30 · 2413 阅读 · 0 评论