自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 论文阅读:SplatMAP: Online Dense Monocular SLAM with 3D Gaussian Splatting

1 Introduction为了实现具有高保真渲染的实时三维重建,研究人员已经探索了将SLAM与可微渲染相结合的潜力。然而,单目SLAM系统,特别是在早期建图阶段,由于观测有限、三角测量基线较浅以及位姿约束较弱,容易产生不准确的点云。这些不准确性会传播到下游建图任务中,导致诸如墙壁和家具上的“重影”等伪影,尤其是从未经训练的视角观察时。传统的三维场景生成系统(3DGS)致密化管道通常依赖RGB损失来纠正这些误差,在补偿初始不准确性时会引入额外的计算开销。为了应对这些挑战,作者提出了SLAM感知自适应致密

2025-01-14 11:15:22 1385 2

原创 论文阅读:EasySplat: View-Adaptive Learning makes 3D Gaussian Splatting Easy

然而,我们在实际场景中的观察发现,高斯分布是不均匀的,较大的高斯往往出现在较小的高斯附近。在基于KNN的分裂之后,大高斯被分解成较小的高斯,导致对较小目标的显着改进,例如图中描绘的汽车。内,将索引为0的视图分配为参考视图,组内的所有其他视图都与该参考视图匹配。由oneref方法构建的点图对得出的相机姿态是次优的,这可能会导致新颖视图合成的性能下降。配对后,所有图像对都被输入到DUSt3R的预训练模型中,以获得每个图像对的成对点图。,我们首先计算每对相邻图像之间的余弦相似度,以量化它们的相似度。

2025-01-14 10:20:11 624 1

原创 论文阅读:4D Gaussian Splatting with Scale-aware Residual Field and Adaptive Optimization for Real-time R

从视频序列中重建动态场景是多媒体领域中一个很有前途的课题。虽然以前的方法已经取得了进展,但它们经常与缓慢的渲染和管理时间复杂性(如重大运动和对象出现/消失)作斗争。在本文中,我们提出了SaRO-GS作为一种新的动态场景表示,能够实现实时渲染,同时有效地处理动态场景中的时间复杂性。为了解决渲染速度慢的问题,我们采用基于高斯基元的表示,并在四维空间中优化高斯分布,从而在三维高斯飞溅的帮助下实现实时渲染。此外,为了处理时间复杂的动态场景,我们引入了尺度感知残差场。

2024-12-11 16:40:46 1106 1

原创 论文阅读:Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering

我们提出了一种有效的辐射场渲染算法,该算法在稀疏体素上结合了光栅化过程,而不需要神经网络或3D高斯。拟议的系统有两个关键贡献。首先是利用动态Morton排序,沿着像素射线以正确的深度顺序渲染稀疏体素。这避免了在高斯溅射中发现的众所周知的弹出伪影。其次,我们自适应地将稀疏体素与场景中的不同细节级别相匹配,忠实地再现场景细节,同时实现高渲染帧率。我们的方法将之前的无神经体素网格表示提高了4db以上的PSNR和超过10倍的渲染FPS加速,实现了最先进的可比较的新视图合成结果。

2024-12-10 15:00:52 500 1

原创 论文阅读:SparseLGS: Sparse View Language Embedded Gaussian Splatting

图1所示。我们使用我们的方法和LangSplat[30]从稀疏、无posefree输入呈现语义渲染。我们的方法在多视图一致性和渲染质量上都优于LangSplat,产生更准确和视觉连贯的结果。最近,一些研究将3D高斯与语言嵌入相结合,以获得用于开放词汇3D场景理解的场景表示。虽然这些方法表现良好,但它们本质上需要非常密集的多视角输入,这限制了它们在现实场景中的适用性。在这项工作中,我们提出了SparseLGS,以解决使用无姿态和稀疏视角输入图像进行3D场景理解的挑战。

2024-12-06 13:54:43 764 1

原创 论文阅读:EVA-GAUSSIAN: 3D GAUSSIAN-BASED REAL-TIME HUMAN NOVEL VIEW SYNTHESIS UNDER DIVERSE CAMERA SETTI

基于前馈的3D Gaussian Splatting方法在实时人类新视角合成方面表现出了卓越的能力。然而,现有的方法局限于密集视角设置,这限制了它们在跨大范围相机视角差异的自由视角渲染方面的灵活性。为了解决这一局限,我们提出了一个名为EVA - Gaussian的实时管线,用于跨不同相机设置的3D人类新视角合成。具体来说,我们首先引入了一个高效的跨视角注意力(EVA)模块,以准确地从源图像估计每个3D高斯的位置。然后,我们将源图像与估计的高斯位置图集成,以预测3D高斯的属性和特征嵌入。

2024-12-04 16:44:27 896 1

原创 论文阅读:SuperGaussians: Enhancing Gaussian Splatting Using Primitives with Spatially Varying Colors

Gaussian Splattings 在基于高斯显式表示的多视图重建中展示出了令人印象深刻的结果。然而,当前的高斯基元只有单视图依赖的颜色和不透明度来表示场景的外观和几何形状,导致了一种非紧凑的表示。在本文中,我们引入了一种名为“超高斯(SuperGaussians)”的新方法,它在单个高斯基元中利用空间变化的颜色和不透明度来提高其表示能力。我们实现了双线性插值、移动核,甚至是小型神经网络作为空间变化函数。

2024-12-03 19:07:12 1251 1

原创 论文阅读:MAGiC-SLAM: Multi-Agent Gaussian Globally Consistent SLAM

具有新颖视角合成能力的同步定位与地图构建(SLAM)系统在计算机视觉中得到了广泛应用,其应用领域包括增强现实、机器人技术和自动驾驶。然而,现有的方法局限于单智能体操作。近期的工作通过使用分布式神经场景表示来解决这个问题。不幸的是,现有的方法速度较慢,无法准确地呈现真实世界的数据,仅限于两个智能体,并且跟踪精度有限。相比之下,我们提出了一种基于刚性可变形3D高斯的场景表示,极大地加快了系统速度。然而,由于轨迹漂移和不同智能体观测的差异,提高跟踪精度和从多个智能体重建全局一致的地图仍然具有挑战性。

2024-12-03 14:53:26 1073 1

原创 论文阅读:Multiview Scene Graph

准确的场景表示对于追求空间智能至关重要,在此智能体能够稳健地重建并高效地理解 3D 场景。场景表示要么是度量式的,比如 3D 重建中的地标地图、目标检测中的 3D 边界框或占用预测中的体素网格;要么是拓扑式的,诸如 SLAM 中含闭环的位姿图或 SfM 中的可见性图。在这项工作中,我们拟从无姿态图像构建多视图场景图(MSG),用相互连接的地点和目标节点从拓扑层面表征场景。构建 MSG 的任务对现有表示学习方法颇具挑战,因其需从视野有限且视角变化可能较大的图像中,同时处理视觉地点识别、目标检测及目标关联问题。

2024-12-02 11:28:52 801 1

原创 论文阅读:DROID-Splat Combining end-to-end SLAM with 3D Gaussian Splatting

场景合成的最新进展使得仅基于以渲染目标优化超图元的独立式 SLAM 系统成为可能[24]。然而,其跟踪性能仍落后于传统的[27]和端到端 SLAM 系统[41]。在鲁棒性、速度和准确性之间尚未达到最佳平衡,对于单目视频尤其如此。在本文中,我们引入一种基于端到端跟踪器的 SLAM 系统,并利用基于最新 3D 高斯溅射技术的渲染器对其进行扩展。我们的框架 DroidSplat 在常见的 SLAM 基准测试中实现了最先进的跟踪和渲染结果。

2024-11-29 16:51:56 1116 1

原创 论文阅读:HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

我们提出了HI-SLAM2,一个几何感知的高斯SLAM系统,仅使用RGB输入即可实现快速准确的单目场景重建。现有的神经SLAM或基于3dgs的SLAM方法经常在渲染质量和几何精度之间进行权衡,我们的研究表明,单独使用RGB输入可以同时实现这两者。我们的方法的关键思想是通过将易于获得的单目先验与基于学习的密集SLAM相结合,然后使用3D Gaussian splating作为我们的核心地图表示来有效地建模场景,从而增强几何估计的能力。

2024-11-29 15:41:09 1260 1

原创 论文阅读:Gassidy: Gaussian Splatting SLAM in Dynamic Environments

如图2中用绿色虚线框突出显示的部分所示,由于我们在相机跟踪过程中的滤波过程,用于映射的高斯函数可能无法覆盖动态对象的区域。来表示对象和背景,而不需要它们的动态特征的详细语义。在本节中,我们定义了动态环境下跟踪和映射优化中使用的损失,并介绍了动态对象滤波的逻辑。与其他3DGS SLAM不同,我们的方法将场景分割为感兴趣的对象和背景,利用两者的误差来优化相机姿势和映射精度。为了处理来自动态对象的不可预测干扰,我们利用3DGS将环境变化表示为不同区域的高斯变化,并以潜在动态对象的实例分割为指导。

2024-11-28 15:30:25 1058 1

原创 zcwzy‘s 源码解读 photo-slam-2 gaussianMapper

可以看出来这里是先进行高斯建图器初始化,再用一个线程启动run,初始化和run都干了啥?

2024-11-04 22:45:37 727

原创 zcwzy‘s 源码解读 photo-slam

简单地说,检查各种输入参数,输入路径,进行图像读取等操作。最主要的是建立slam线程pSLAM,3d高斯建图线程,和地图显示线程。包含main函数,用于读取图片的LoadImages,保存轨迹/显存使用峰值的saveTrackingTime和saveGpuPeakMemoryUsage函数。├─examples # 此文件夹是SLAM系统的演示入口,用于读取数据,创建指针并建图。以下操作分别是创建slam系统,创建3d高斯建图系统和创建3d高斯查看器。├─third_party # 奇奇怪怪的第三方包。

2024-10-31 20:57:06 526

原创 2021 寄网 数据库 西电 大题 软工

死了啦

2022-03-15 19:12:11 1309

原创 刘坚 编译原理基础 学习笔记(6)类型检查

类型:类型是一个系统,由一组的集合&值集合上的操作组成的系统。表示为type=(value-set,operator-set)值只能进行操作集合中允许的操作。一、简单的类型检查1.一个简单的程序设计语言它具有声明部分D和表达式部分E,并且先声明再引用。2.表达式的类型检查当声明语句被确定类型后,可执行语句中表达式E的类型可以如此检查3.语句的类型检查...

2021-08-11 15:15:06 2546

原创 刘坚 编译原理基础 学习笔记(5)声明语句的翻译

一、变量的定义和声明1.变量的类型定义与声明类型定义为编译器提供储存空间的大小信息,而变量声明为变量分配储存空间2.变量声明的语法制导翻译二、数组变量的声明数组在符号表中占领与简单变量同样多的域,对于数组的详细信息另外安排内情向量来记录,并且符号表中应有一个指针指向内情向量地址。1.静态数组的内情向量为了数组元素的引用,数组声明时需要保存的信息包括offset,数组的维...

2021-08-10 18:56:14 2583

原创 刘坚 编译原理基础 学习笔记(4)中间代码+符号表

中间代码(1)后缀式(逆波兰表示)典型特征是操作数在前,操作符紧跟其后。例如:a+b*c -> abc*+(2)三地址码result:=arg1 op arg2 / result:=op arg1或op arg2。形式上是最多仅由一个二元运算组成的赋值句。例如x:=a+b*c可以是T1:=b*cT2:=a+T1x:=T2...

2021-08-09 18:22:23 754

原创 刘坚 编译原理基础 学习笔记(3)语法翻译制导

与语法分析类似的,语义分析也具有双重作用:(1)检查结构正确的句子所表示的意思是否合法(2)执行规定的语义动作应用最广的是语法制导翻译。语言结构的语义以属性的形式赋予代表此结构的文法符号,属性的计算以语义规则的形式赋予由文法符号组成的产生式。(1)属性文法符号属性的抽象表示采用『点+标识符』的方法。例如对于表达式E,可以用E.val表示表达式的值。(1) b是A的属性,ci是X1X2..Xn中的文法符号的属性,或者A的其他属性...

2021-08-08 18:57:43 602

原创 刘坚 编译原理基础 学习笔记(2)语法分析

(1)上下文无关文法定义:上下文无关文法是一个四元组G={N,T,P,S},其中 N是非终结符的有限集合,这里默认为大写(比如“E”) T是终结符的有限集合,并且T和N交集为空。这里默认为小写(比如“id”) P是产生式的有限集合。产生式形如A->α,其中A在N中 S是非终结符,被称为文法的开始符号举例:N={S,动词,名词},T={羊,水,吃,草,喝},开始符号S,...

2021-08-06 15:37:22 1000

原创 刘坚 编译原理基础 学习笔记(1)词法分析

1.记号,模式与单词。模式(pattern):产生/识别单词的规则 记号(token):按照某个模式(或规则)识别出的元素 单词(lexeme):被识别出的元素的值2.词法分析器的作用滤掉无用成分,比如注释,回车,空格 处理与具体平台有关的输入。比如文件结束符可能有不同表示,需要具体分析 识别记号并交给语法分析器 调用符号表管理器和出错处理器,进行相关处理 词法分析器的两种工作模式:(1) 作为语法分析器的子程序;(2) 词法分析器单独进行一遍扫描;(3) 与语法分析...

2021-08-02 18:51:17 628

原创 刘坚 编译原理基础 学习笔记(0)引言

1.语言的翻译 高级语言之间的翻译一般被称为转换/预处理,如FORTRAN到Ada的转换,SQL到C/C++的预处理等 高级语言可以直接翻译成机器语言,也可以翻译成汇编语言,这两个过程都称为编译。 从汇编语言到机器语言的翻译叫做汇编,将一个汇编语言程序汇编为可在另一机器上运行的机器指令,称为交叉汇编。建立在交叉汇编基础之上的编译模式有时也称为交叉编译 逆向工程,如机器语言->汇编语言,或者汇编语言->高级语言,分别称为反汇编&...

2021-08-01 20:26:32 233

原创 2021 西电 软工 计组 期末试题题型(回忆版)

今天刚考完。这是帮助后面的学习学妹复习而撰写的,数据我记不住了,2020年的考试题型请参考:https://github.com/LevickCG/Happy-SE-in-XDU/blob/master/%E8%AE%A1%E7%BB%84I/2020_final.md虽然2020有疫情奖励难度变低,但是2021和2020我感觉难度没什么太大的差别同样的,如果你想冲高分,一定要把课后习题全部搞懂。想要练习的话可以去图书馆白嫖王道考验,练他的加减乘除即可第一部分是6选5,每个7分,共35分

2021-07-02 19:30:40 4533 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除