Abstraction.-优快云博客

原创【论文阅读笔记】Deformable 3D Gaussian for High-Fidelity Monocular Dynamic Scene Reconstruction

例如，在动态场景中，物体的运动轨迹、速度、加速度、刚性或非刚性变形等都是与时间紧密相关的几何特性。现实中的数据集位置是不精确的，可能会导致过拟合和时间抖动，以前的隐式表示因为神经网络固有的平滑性，所以影响比较小，对于3DGS显示表示会造成较为严重的干扰。（topological shift）：物体的结构或连接方式发生了根本性的改变，而不仅仅是位置或形状的变化，比如物体分裂、合并，出现、消失等。：位置编码，同transformer的正余弦结构，合成数据集位置编码坐标为10个维度，时间为6个维度；

2024-11-06 22:50:10 1103 1

原创【论文阅读笔记】DDPM: Denoising Diffusion Probabilistic Models

Qxt∣xt−1前排提示：本片笔记纯属自己写给自己看，里面有不少自己的理解和引用，如有侵权请删除联系：对一张已有的图片先进行前向加噪，通过概率论数学推导发现反向生成需要预测噪声，所以让一个神经网络去学习这个加噪过程的规律，之后取一个随机噪音，结合这个网络进行逐步去噪完成反向生成题外话：怎么生成服从高斯分布的数据（设U1U2相互独立且服从均匀分布U01，令R−2logU1θ2πU2,则XRcosθYRs。

2024-10-30 23:43:21 1113 1

原创【论文阅读笔记】Vit：VisionTransformer

纯粹的将transformer应用于图片patch序列，而不是使用attention连接到CNN中或替换一些部件在没有强正则化的中型数据集（如 ImageNet）上进行训练时比ResNet的性能要低一些：Transformer缺少CNN的一些先验条件，比如平移等效性和局部性。

2024-10-29 00:19:06 744 1

原创【论文阅读笔记】Mip-Nerf

采样频率不足时（小于奈奎斯特采样频率）会导致高频信号被识别为低频信号，产生失真或者伪影Mip mapping：为每个纹理生成一系列不同分辨率的图像，通常称为mipmap级别。最高分辨率的图像作为基准，后续的级别则逐渐减小，形成一个从高到低的纹理金字塔。（图中高频的红线因为采样频率过低被采样成了低频的蓝线）

2024-10-27 22:41:20 882 1