
论文阅读
文章平均质量分 93
该专栏记录一些技术论文阅读心得与分析,在给自己做备忘的同时,也为需要了解相关技术的同学提供一些学习的思路。
程序猿老甘
NTU博后,主要研究领域为图形学,计算机视觉,几何分析等。
展开
-
3D高斯溅射:面向三维场景的实时渲染技术
高斯溅射技术一经推出,立刻引起学术界和工业界的广泛关注。相比传统的隐式神经散射场渲染技术,高斯溅射依托椭球空间,显性地表示多目图像的三维空间关系,其计算效率和综合性能均有较大的提升,且更容易理解。可以预见,未来2年针对高斯溅射的应用研究将会迎来爆炸式发展。通过本篇博文,我和大家来一起了解高斯溅射技术,希望对有需要的同学提供一点帮助。原创 2024-02-11 22:14:10 · 11133 阅读 · 2 评论 -
Multidimensional Scaling(MDS多维缩放)算法及其应用
在这篇博客中,我将与大家分享在流形分析领域的一个非常重要的方法,即多维缩放MDS。整体来说,该方法提供了一种将内蕴距离映射到显性欧氏空间的计算,为非刚性形状分析提供了一种解决方案。当初就是因为读了Bronstein的相关工作[1],才下定决心在人脸数据分析中使用内蕴度量来建立特征分析方法,可以说MDS对我的学术之路起到了很大的影响作用。原创 2023-12-06 18:01:49 · 782 阅读 · 0 评论 -
Geodesic in Heat: 一种测地线计算方法
在之前的博客中,我已经介绍过了使用Fast Marching算法计算测地线。Fast Marching的好处是实现简单,方便扩展在点云上。但是缺点是精度不够,求解不平滑。早在2013年,Crane et al. [1]就已经提出利用热流来估算测地距离。我很早就知道这个解决方案,大概是利用了拉普拉斯余切权重来实现一个二阶偏微分计算,以获得更精确的结果。这次恰好要做点云上的测地线计算,就把原文下载下来好好的学习一下。原创 2023-12-05 18:44:00 · 1397 阅读 · 0 评论 -
GAN网络系列博客(三):不受坐标限制的GAN(StyleGAN3)
关于StyleGAN3,其贡献已经在题目中说的非常清楚了,不受坐标限制(Alias-Free)。在没有认真看正文文字内容的前提下,仅通过上面的图片,我对StyleGAN3实现的猜测是,首先找到对应的语义区域,之后建立非刚性的对应关系,在此基础上指导生成模型,并控制生成对象不超过语义限定区域,使得整个变换过程类似于非刚性形变过程。带着这样一种猜测,我们来看一下StyleGAN3的具体实现。原创 2023-04-17 19:26:38 · 1606 阅读 · 1 评论 -
KSS-ICP: 基于形状分析技术的点云配准方法
三维点云配准是三维视觉领域一个经典问题,涉及三维重建,定位,SLAM等具体应用问题。最近,南洋理工大学的研究人员提出一种新的点云配准方法KSS-ICP,结合了形状分析与传统ICP算法,有效的改善了配准算法的性能。今天,我在这篇博客里就来介绍一下这篇论文。原创 2023-03-27 17:09:20 · 2500 阅读 · 1 评论 -
基于颜色直方图优化的图像增强方法
最近改图像颜色迁移的论文,审稿人要求补充基于直方图优化的方法细节。趁此机会,我重新下载了相关文献,决定重新学习下该类方法,并把一些细节记录在本篇博客中,供交流学习。原创 2022-12-29 14:24:21 · 1676 阅读 · 3 评论 -
基于测地距离场的三维人脸参数化方法
三维人脸数据的识别与处理,一直是视觉与图形学领域的热点问题。相对于人脸图像来说,三维人脸数据拥有完整的几何信息,能够支持更加精确的人脸数据分析算法。在进行相关的计算之前,我们希望三维人脸能够有一个统一的表示形式,以准确的界定人脸的区域以及对应的位置,尽可能的消除姿态以及尺度不一致带来的影响。基于该目的,人脸参数化方法被提出。原创 2022-09-02 16:23:44 · 1602 阅读 · 0 评论 -
点云深度学习系列博客(三): 多尺度特征分析
最近做深度学习研究,发现在视觉任务中,使用多尺度特征建立对图像的特征描述,大概率能够得到好的结果。自然地,如果能把多尺度特征推广到点云分析的任务中,直观感觉应该也能够获得性能提升。正好最近researchgate推给我一篇论文[1],就是基于该想法提出了一个网络实现。今天就来跟大家一起学习下这篇文章,看一看如何利用多尺度特征提升点云分析任务的性能。...原创 2022-08-15 17:51:36 · 5141 阅读 · 7 评论 -
CVPR2022Oral专题系列(三):图像增强主干网络MAXIM
随着Transformer和多层感知机技术的普及,一些过去难以解决的计算机视觉问题,能够被处理,并在实际的应用中加以使用。但是,这里仍然存在一些挑战,包括:对高分辨率图像的兼容性较差;对局部注意力缺乏有效的处理方法。今天,我们来介绍一篇CVPR2022Oral论文,即多轴MLP结构MAXIM,以解决上述问题。...原创 2022-08-05 18:24:51 · 3766 阅读 · 3 评论 -
CVPR2022Oral专题系列(二):多帧图像合成与增强
在本系列的上一篇博客中,我们已经介绍了一种低光图像的处理方法。对于一般性的手持拍照设备,受限于抖动以及对象运动的影响,使得单帧图片会产生模糊。为了完成对类似图像的质量增强,Burst Image Restoration被提出。其原理为通过设备所获取的一个图像序列,通过对帧间相关信息的分析,以实现对模糊的处理,进而增强图像质量。本博客今天介绍一种方法,Burst Image Restoration and Enhancement [1],以完成该目标。......原创 2022-08-02 19:08:47 · 6925 阅读 · 7 评论 -
CVPR2022Oral专题系列(一):低光增强
这周立了Flag,一定要出一篇关于CVPR2022Oral论文解度博客。刚刚完成一个期刊的大修,马上就打开优快云,就敲起键盘来。可见做什么事儿,都得有一口气顶住,才能不拖沓。闲话少叙,今天我们介绍的文章是大连理工大学的研究者所提出的一项关于低光增强的工作。...原创 2022-07-24 20:33:46 · 4669 阅读 · 3 评论 -
浅谈CVPR2022的几个研究热点
CVPR2022刚刚结束,作为影响力最广的视觉盛会,今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴,已经磨拳擦掌,准备向CVPR2023投稿了。基于今年的工作,到底哪些领域是CVPR关注的热点?哪些领域的工作,接受度更高,oral的比例更大呢?基于CVPR官方最新的统计信息,我将跟大家聊聊CVPR的一些研究热点,希望对那些计划投下一轮CVPR的同学提供一点参考信息。............原创 2022-06-25 15:06:43 · 13550 阅读 · 2 评论 -
浅谈调和形状上下文特征HSC对3DSC的改进
在上一篇博客中(浅谈三维形状上下文特征3DSC理论及应用),我们已经介绍了3DSC的设计原理以及实现细节,以及该特征在一定程度上受限于法线估计的缺陷。事实上,在文献[1]中,作者在提出3DSC的同时,也给出了对应的解决方案,以缓解3DSC的内在缺陷,即调和形状上下文特征HSC。今天我们将具体学习一下HSC的原理以及实现。.........原创 2022-06-10 13:59:44 · 693 阅读 · 1 评论 -
浅谈三维形状上下文特征3DSC理论及应用
在之前的博客中,我们已经介绍过了使用FPFH在点云上建立局部形状描述,实现对点云局部隐曲面几何特征的高效表达(浅谈FPFH算法实现原理及其在点云配准中的应用)。今天,我们将介绍另外一种局部形状描述子: 3DShapeContext (3DSC)。最近上课需要准备这部分内容,本打算找一个现成的博客学习一下了事的。但是看了几个博客,感觉还是差点意思,于是我下载了原始论文,从头读了一遍,将一些原理与实现细节在这篇博客做个展开,希望能够帮助到有需要的同学。...原创 2022-06-09 19:02:37 · 2782 阅读 · 3 评论 -
基于Pytorch实现的图像分割算法: DeepLabV3+
图像分割可以算是图像处理领域最重要的几个问题之一了。随着自动驾驶,广告推荐,手机照片处理,知识图谱等智能应用的快速普及,基于语义分析的图像分割、理解与识别变得越来越重要。近年来比较热的视觉领域工作,很大比重是围绕如何使用大规模数据,结合结构优良的深度网络模型,实现图像分割计算。今天,我们就来学习一项该领域的著名工作(DeepLabV3+)。原创 2022-05-31 14:17:52 · 24466 阅读 · 18 评论 -
点云深度学习系列博客(二): 点云配准网络PCRNet
凡是对点云相关应用有些了解的同学,相信都接触过点云配准。配准相关的经典算法,包括ICP,NDT,FPFH,已被广泛应用于工业设计,定位,SLAM,自动驾驶等领域。尤其在SLAM和自动驾驶领域,随着家庭清扫机器人和电动汽车的普及,基于激光扫描技术的点云配准技术越发重要。可见点云配准及其相关研究的重要性。今天的点云深度学习系列博客为大家介绍一个用于点云配准深度网络:PCRNet [1]。原创 2022-05-20 18:36:41 · 6161 阅读 · 4 评论 -
点云深度学习系列博客(一): 点云特征学习网络PCPNet
最近开始研究点云分析的相关项目,经过文献调研我发现,近几年比较热的方法,基本都是基于深度学习框架设计的。正好我计划在2022年切入点云深度学习这个研究方向,于是我决定创建一个博客专题,翻译和编辑一批具有代表性意义的点云深度学习研究报告,即方便为我自己的研究计划提供素材,又希望能够帮助到有需要的小伙伴参考与学习。如果你对这个专题感兴趣,希望能够关注我的博客,那将是对我创作的最大支持。原创 2022-04-30 13:08:50 · 5697 阅读 · 1 评论 -
正态分布变换NDT算法原理及其在点云配准中的应用
正态分布变换Normal Distributions Transform(NDT)方法最早由Biber于2003年提出。该方法最早用于解决SLAM问题中,激光扫描数据的匹配问题。该方法的核心思路是通过建立数据基于概率密度的表示形式,构建一个对匹配的连续的评估函数,并且连续可微。这样,匹配问题就转换成了对一个连续函数的极值优化问题。下面,我们就来展开介绍下NDT算法的一些理论知识与技术细节。原创 2022-04-25 15:14:54 · 6080 阅读 · 0 评论 -
基于GMM模型的图像分割与颜色迁移算法
我们在之前的博客中已经介绍过了一些主流的图像颜色迁移方法。这些方法一般通过计算全局颜色分布对应或者语义分析对应,来构建颜色迁移策略。这带来了一个问题,就是对图像建立一个统一的颜色迁移策略,会降低颜色映射的灵活性,使得结果图缺少色彩的对比度,不能突出一些特定的区域。一个简单的解决方案是首先把图像分成不同的色块或者基于颜色分类的不同区域,然后针对这些区域来建立不同的颜色映射方案。基于GMM模型的图像颜色迁移方法,就是通过GMM来实现图像分割,然后基于分割结果,建立分区域的颜色迁移方案,获得更好的结果。原创 2022-04-17 13:01:01 · 4399 阅读 · 0 评论 -
浅谈研究生对科研工作的那些认知误区
最近带了很多硕士研究生做科研,欣喜于年轻一辈的学习动力与热情,以及对工作的认真态度,与我读硕士的时候相比,确实不可同日而语。我那时候,发个EI会议都是值得一说的,现在都要发顶会顶刊,发一般的SCI的期刊都不够看,也是卷的可以了。虽然大家干劲十足,也希望能够做出好的工作,但是也不得不承认,在教学过程中,各个水平的学生,哪怕拥有极好天赋的学生,在进行科研学习之初,都会存在一些认知误区。带有这些误区,会增加学生在科研工作中的挫折感。长时间的原地打转与不能理清工作方向,拖延效率是一方面,给人带来的精神压力更是不能忽原创 2022-04-02 16:33:08 · 1969 阅读 · 0 评论 -
浅谈FPFH算法实现原理及其在点云配准中的应用
统计分析方法在看一个点是否为特征点时,除了考虑该点的几何特征,同时还会考虑该点附近的区域,一些几何特征的分布情况。这样做的好处就是避免了一些异常的点被错误识别的情况。其原理在于,一个或少数几个点带有异常值,会破坏特征识别,但是我们分析这些异常点的邻域,对邻域内的点做统计计算,就会显著降低异常权重,使得对该点或者该区域的几何特征表述,更加稳定。FPFH算法正是基于该思想所提出。...原创 2022-04-01 14:39:18 · 20111 阅读 · 19 评论 -
火爆科研圈的三维重建技术:Neural radiance fields (NeRF)
如果说最近两年最火的三维重建技术是什么,相信NeRF[1]是一个绝对绕不过去的名字。这项强到逆天的技术,一经提出,就被众多研究者所重视,并投入人力对该技术进行深入研究并改进。仅仅过了不到两年的时间,NeRF及其变种网络已经成为重建领域的主流方法。由此可见,NeRF技术的新颖性与实用性。今天,我们就来看一看NeRF是个啥,学习以下该方法到底强在哪里。1. 简介NeRF全称为Neural Radiance Fields(神经辐射场),是一项利用多目图像重建三维场景的技术。该项目的作者来自于加州大学伯..原创 2022-02-20 17:43:41 · 35535 阅读 · 2 评论 -
Gaussian Mixture Model:混合高斯模型介绍
最近看一些计算机视觉和图形学类的文章,经常发现一个被称为Gaussian mixture model(GMM)的技术,应用在图像图形处理的算法中。出于好奇,我最近阅读了GMM的文献[1]。基于该文献,我将在这篇博客介绍一下GMM的一些核心思想以及比较成功的应用。1. 简介GMM是一个参数概率密度函数,由加权的分块高斯密度和表示。GMM通常被用来表示一个概率密度分布的参数模型,以提供一个特征度量。GMM的参数由训练数据获得,通过迭代计算Expectation-Maximization(EM,最大期望)原创 2022-02-16 19:50:33 · 3619 阅读 · 0 评论 -
Nvidia最新三维重建技术Instant-ngp初探
最近逛技术论坛,发现一个牛到了不得的英伟达项目,刚刚发布,其全称为:Instant Neural Graphics Primitives,项目链接为:https://github.com/NVlabs/instant-ngp该项目提出一个称为Multiresolution Hash Encoding的技术,能够大大提升NeRF网络的训练速度,使之可以从几分钟缩短到几秒钟(非常惭愧的是,NeRF这个被广泛接受的三维重建技术我也是第一次听说)。其演示结果好的让人震惊。...原创 2022-04-22 20:44:15 · 27530 阅读 · 6 评论 -
Neural-Enhance:图像增强与超分辨率开源项目
最近因为在做图像颜色迁移相关的研究工作,顺便也看了一些下图像增强与超分辨率的项目。因为在颜色迁移前,如果能够对图像的细节进行增强甚至重建,那么颜色迁移的结果肯定会好一些,所以我希望尝试添加图像增强的相关功能到颜色迁移中来。今天就来介绍一个我在github上发现的项目:Neuro-Enhance.Project Link:GitHub - alexjc/neural-enhance: Super Resolution for images using deep learning.1. 简介2.原创 2022-01-22 14:18:58 · 5803 阅读 · 1 评论 -
图像颜色迁移专题介绍(三): Deep Examplar-based Colorization
在之前的两篇博客中,我们已经介绍了关于color transfer在2015年之前的一些主流的研究思路,即在相应的颜色空间中,利用语义对应关系,实现语义一致的颜色迁移。博客链接:图像颜色迁移专题介绍(一):Global Color Transfer图像颜色迁移专题介绍(二):Correspondence稍微对color transfer有些研究的同学,就能够发现上述传统方法的缺点,即语义对应的泛化性问题。通常,我们在指定参考图像时,主观上应该只是一个比较粗略的概念,觉得某张图片的颜色很好,具有美原创 2022-01-16 12:53:13 · 3723 阅读 · 3 评论 -
图像颜色迁移专题介绍(二): Correspondence
正如上一篇博客Global Color Transfer所介绍的那样,直接建立图片到图片的全局颜色迁移,可能会出现各种映射异常。在没有考虑到语义对应的情况下,建立的颜色迁移往往不能满足要求。一个非常容易想到的改善方案,就是建立图片的语义对应区域,并根据这些对应区域提供的约束,重新设计颜色映射函数,使得在颜色迁移后,语义关联的区域能够有更准确的结果。因此,在全局颜色映射提出后的相当一段时间,研究者的重点就放在了怎样找到图片中语义的对应关系上。原创 2021-11-27 20:10:54 · 3822 阅读 · 1 评论 -
图像颜色迁移专题介绍(一): Global Color Transfer
最近因为种种工作的要求,需要我在视觉领域找一个题目做一做。我决定重操旧业,把我硕士阶段曾经研究过一小段时间的图像颜色迁移重新拾起来,看一下有什么可以做的东西。本篇博客就是我最近做算法调研时候的一些思路的分享,希望给那些做类似研究的同学提供一点帮助。原创 2021-11-18 19:55:36 · 5975 阅读 · 4 评论 -
图形学高被引论文赏析系列2:Laplacian Surface Editing
今天论文赏析系列介绍的这篇文章为Laplacian Surface Editing。这篇文章比较牛的地方除了较高的引用量外,还有就是作者的阵容,这个会在下面详细介绍。这篇文章基于intrinsic property这个概念,在曲面定义了一个点的邻域邻接关系。基于这样一种邻接关系,表示为Laplacian算子,可以实现曲面的编辑,曲面到曲面的几何特征转换和混合,以及曲面的移植。所有的操作都在一个稀疏的线性方程组中完成。这些编辑操作能够在实现曲面编辑的同时,保持局部的曲面细节。...原创 2021-08-31 16:05:52 · 1743 阅读 · 0 评论 -
图形学高被引论文赏析系列1:Geometry Images
Unreal5的高分辨率三角网格实时渲染功能Nanite,相信给大家带来了足够的震撼。那么其背后的技术是什么呢?经过多方考证,就是Geometry Images(几何图像)。本文就来和大家一同探索一下该项技术到底是一项什么样的技术,都能应用在哪些方面。1. 作者介绍该文第一作者为石溪大学的顾险峰老师,合作者为哈佛的Steven J. Gorler和微软的Hugues Hoppe. 顾老师师从丘成桐教授,其在离散微分几何与图形学交叉研究领域享有盛誉。其在2002年左右发表的共形几何系列文章,解决了具有原创 2021-08-17 19:08:04 · 1485 阅读 · 2 评论