- 博客(9)
- 收藏
- 关注
原创 【论文阅读笔记】Deformable 3D Gaussian for High-Fidelity Monocular Dynamic Scene Reconstruction
例如,在动态场景中,物体的运动轨迹、速度、加速度、刚性或非刚性变形等都是与时间紧密相关的几何特性。现实中的数据集位置是不精确的,可能会导致过拟合和时间抖动,以前的隐式表示因为神经网络固有的平滑性,所以影响比较小,对于3DGS显示表示会造成较为严重的干扰。(topological shift):物体的结构或连接方式发生了根本性的改变,而不仅仅是位置或形状的变化,比如物体分裂、合并,出现、消失等。:位置编码,同transformer的正余弦结构,合成数据集位置编码坐标为10个维度,时间为6个维度;
2024-11-06 22:50:10
1103
1
原创 【论文阅读笔记】DDPM: Denoising Diffusion Probabilistic Models
Qxt∣xt−1前排提示:本片笔记纯属自己写给自己看,里面有不少自己的理解和引用,如有侵权请删除联系:对一张已有的图片先进行前向加噪,通过概率论数学推导发现反向生成需要预测噪声,所以让一个神经网络去学习这个加噪过程的规律,之后取一个随机噪音,结合这个网络进行逐步去噪完成反向生成题外话:怎么生成服从高斯分布的数据 (设U1U2相互独立且服从均匀分布U01,令R−2logU1θ2πU2,则XRcosθYRs。
2024-10-30 23:43:21
1113
1
原创 【论文阅读笔记】Vit:VisionTransformer
纯粹的将transformer应用于图片patch序列,而不是使用attention连接到CNN中或替换一些部件在没有强正则化的中型数据集(如 ImageNet)上进行训练时比ResNet的性能要低一些:Transformer缺少CNN的一些先验条件,比如平移等效性和局部性。
2024-10-29 00:19:06
744
1
原创 【论文阅读笔记】Mip-Nerf
采样频率不足时(小于奈奎斯特采样频率)会导致高频信号被识别为低频信号,产生失真或者伪影Mip mapping:为每个纹理生成一系列不同分辨率的图像,通常称为mipmap级别。最高分辨率的图像作为基准,后续的级别则逐渐减小,形成一个从高到低的纹理金字塔。(图中高频的红线因为采样频率过低被采样成了低频的蓝线)
2024-10-27 22:41:20
882
1
原创 【论文阅读笔记】VAE-差分自编码器
最近在学习生成模型相关的知识,无疑VAE是非常重要的内容,但是该部分内容确实不容易理解,网上给出的帖子不少也存在一些自洽方面的问题,尝试了总结了网上看到的一些帖子,融合出了一种自己能理解起来容易接受并且容易记忆的方法。
2024-10-26 14:41:40
1080
1
原创 【论文阅读笔记】3D Gaussian Splatting
说明:阅读笔记主要仅供个人学习使用从点云出发建立辐射场,通过colmap使用SfM获得初始点云,之后变点云为高斯椭球,通过机器学习进行重建。
2024-10-21 23:56:38
1037
1
原创 【人工智能导论】实验代码合集
本帖子主要记录实验的代码,方便日后需要的时候对这些基础架构的手写代码进行复习,虽然代码多数来源于网络和GPT生成,但是在实际做实验的时候也做过很多修改,相对比较熟悉,因此做一份备份。
2024-04-25 08:43:13
626
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人