自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【论文阅读笔记】Deformable 3D Gaussian for High-Fidelity Monocular Dynamic Scene Reconstruction

例如,在动态场景中,物体的运动轨迹、速度、加速度、刚性或非刚性变形等都是与时间紧密相关的几何特性。现实中的数据集位置是不精确的,可能会导致过拟合和时间抖动,以前的隐式表示因为神经网络固有的平滑性,所以影响比较小,对于3DGS显示表示会造成较为严重的干扰。(topological shift):物体的结构或连接方式发生了根本性的改变,而不仅仅是位置或形状的变化,比如物体分裂、合并,出现、消失等。:位置编码,同transformer的正余弦结构,合成数据集位置编码坐标为10个维度,时间为6个维度;

2024-11-06 22:50:10 1103 1

原创 【论文阅读笔记】DDPM: Denoising Diffusion Probabilistic Models

Qxt​∣xt−1​前排提示:本片笔记纯属自己写给自己看,里面有不少自己的理解和引用,如有侵权请删除联系:对一张已有的图片先进行前向加噪,通过概率论数学推导发现反向生成需要预测噪声,所以让一个神经网络去学习这个加噪过程的规律,之后取一个随机噪音,结合这个网络进行逐步去噪完成反向生成题外话:怎么生成服从高斯分布的数据 (设U1​U2​相互独立且服从均匀分布U01,令R−2logU1​​θ2πU2​,则XRcosθYRs。

2024-10-30 23:43:21 1113 1

原创 【论文阅读笔记】Vit:VisionTransformer

纯粹的将transformer应用于图片patch序列,而不是使用attention连接到CNN中或替换一些部件在没有强正则化的中型数据集(如 ImageNet)上进行训练时比ResNet的性能要低一些:Transformer缺少CNN的一些先验条件,比如平移等效性和局部性。

2024-10-29 00:19:06 744 1

原创 【论文阅读笔记】Mip-Nerf

采样频率不足时(小于奈奎斯特采样频率)会导致高频信号被识别为低频信号,产生失真或者伪影Mip mapping:为每个纹理生成一系列不同分辨率的图像,通常称为mipmap级别。最高分辨率的图像作为基准,后续的级别则逐渐减小,形成一个从高到低的纹理金字塔。(图中高频的红线因为采样频率过低被采样成了低频的蓝线)

2024-10-27 22:41:20 882 1

原创 【论文阅读笔记】VAE-差分自编码器

最近在学习生成模型相关的知识,无疑VAE是非常重要的内容,但是该部分内容确实不容易理解,网上给出的帖子不少也存在一些自洽方面的问题,尝试了总结了网上看到的一些帖子,融合出了一种自己能理解起来容易接受并且容易记忆的方法。

2024-10-26 14:41:40 1080 1

原创 【论文阅读笔记】3D Gaussian Splatting

说明:阅读笔记主要仅供个人学习使用从点云出发建立辐射场,通过colmap使用SfM获得初始点云,之后变点云为高斯椭球,通过机器学习进行重建。

2024-10-21 23:56:38 1037 1

原创 【编译技术】实验二:语法制导的三地址代码生成程序

目前完成至语法分析部分,语义部分后续再加。

2024-05-14 23:12:36 2219 4

原创 【人工智能导论】实验代码合集

本帖子主要记录实验的代码,方便日后需要的时候对这些基础架构的手写代码进行复习,虽然代码多数来源于网络和GPT生成,但是在实际做实验的时候也做过很多修改,相对比较熟悉,因此做一份备份。

2024-04-25 08:43:13 626 1

原创 【编译技术】实验一:词法分析程序编制

基本掌握计算机语言的词法分析程序的开发方法。

2024-04-15 10:43:09 1491 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除