自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【ChatGPT给的解决方案:stylegan3 docker】

ChatGPT给的解决方案:stylegan3 docker

2024-05-23 13:52:15 539 1

原创 【StyleGAN】Robust Unsupervised StyleGAN Image Restoration论文代码复现

-----------------------------------------------------------分割线----------------------------------------------------------因为这里的StyleGAN直接使用的预训练好的权重,如果需要将此方法用在自己的数据集上,需要重新训练网络,生成自己数据集的权重。training_loop.py文件中可以启动tensorboard会话,这样每次训练的结果都可以在网页上看到。

2024-04-11 19:51:30 1284 12

原创 【组会论文2023.02.05】Robust Dynamic Radiance Fields阅读笔记

把组会讲过的论文整理一下,留个痕迹.......组会第七篇论文一种基于随机视频的动态辐射场重建算法RoDynRF引言sfM通过相机的移动来确定目标的空间和几何关系。算法在具有高度动态对象、纹理不良的表面和旋转摄像机运动的具有挑战性的视频中产生错误的姿势,例如低光照条件下的噪声图像、用户引起的运动模糊或场景中的动态对象(如人、汽车和动物)。本文提出了一种来自动态单目视频的时空合成算法,该算法不需要已知的相机姿势和相机特性作为输入。

2024-03-15 14:00:00 1086 1

原创 【组会2023.12.11】I2-SDF:Intrinsic Indoor Scene Reconstruction and Editing via Raytracing in Neural SDFs

来执行场景重新渲染。首先通过公式(21)对相机视图中的光线进行投射,得到与每个像素相关的表面点,并通过公式(6)得到对应的表面法线。由神经SDF场Fd,神经辐射场Fc,神经材料场Fa和Fp,和发射场Fe组成,最后是蒙特卡罗渲染层,该层使用分解的因子重新渲染场景图象。提出了一个新的合成多视图室内场景数据集,提供了精心设计的室内场景,具有地面真实相机姿势,法线和深度图,具有优于现有数据集的图像质量。是蒙特卡洛积分的一种采样策略,抽样时以更大的概率抽取函数值对积分贡献较大的区域的样本,这样能够提高估计的准确度。

2024-03-15 11:00:00 1040 1

原创 【组会论文2023.11.06】Learning Detailed Radiance Manifolds for High-Fidelity and 3D-Consistent Portrai阅读笔记

在一般反演阶段,输入图像首先通过图像逆变器将给定图像映射到高效的GRAM潜在空间,接着将给定图像反演三平面生成器的W+空间中为潜在编码,以便在反演保真度和姿态编辑质量之间进行适当的权衡。为进一步提高重建保真度,作者按照渐进训练方法对图像逆变器进行训练,并将训练后的图像逆变器进行固定,并利用所有训练图像通过中枢调整策略对高效GRAM进行微调,此时一般反演阶段可以合成输入的合理的多视图图像,但是不能很好地保留细节。我们的方法很好地保留了输入图像的细节(如刘海、皱纹、痣),并产生了3D一致的新视图。

2024-03-15 09:45:00 982 1

原创 【组会论文2023.06.23】Label-Free Liver Tumor Segmentation阅读笔记

训练AI模型时往往需要大量人工标注数据,医学图像的标注不仅昂贵耗时,而且还需要医学专业知识,有时还需要放射报告和活检结果的辅助才能保证注释的准确性。另外现有研究中的合成肿瘤与真实肿瘤差异很大,使用合成肿瘤训练的AI模型的表现远不如真实肿瘤训练的模型。(头重)为此,本文手工制作了一种在腹部CT扫描中合成肝脏肿瘤的策略。(,)此策略主要关注肿瘤的形状、强度、尺寸、位置和纹理这几个重要因素。

2024-03-14 20:30:00 984

原创 【组会论文2023.06.16】Zero-Shot Object Counting阅读笔记

为解决类不可知对象计数需要人工注释样本作为输入的问题,本文提出零样本对象计数(ZSC)任务的方法。该方法可以对输入图像中的特定目标物体进行计算,在计数过程中只需要给定物体类名,而不需要给定任何人工注释的示例。在此基础上,本文也提出一种简单有效的patch选择方法,可以在查询图像上准确定位最优patch作为待计数目标。本文提出一个新的任务,零样本目标计数;用于计算只给定类名的特定类的实例,而不访问任何示例。在预先训练的特征空间中构建一个类原型,并使用该原型来选择包含感兴趣对象的patch;

2024-03-14 19:26:40 1939 6

原创 【组会论文2023.05.05】Pre-Trained Image Processing Transformer阅读笔记

现有的计算机视觉和自然语言的预训练研究主要聚焦于分类任务,较少用于图像处理任务中。本文中作者对底层计算机视觉任务(如去噪、超分辨率和去雨)中的预训练技术进行研究,提出一种新的预训练模型,即图像处理transformer(Image Processing Transformer,IPT)。IPT使用一个多头多尾共享transformer主体的结构,针对不同的任务,使用不同的头部和尾部。在该预训练模型中编码器采用常规结构,即将头部输出的特征图像展开成“词向量”的形式和位置嵌入相加后输入到编码器中进行编码。

2024-03-14 14:24:03 1891

原创 【组会论文2023.04.03】UP-DETR: Unsupervised Pre-training for Object Det阅读笔记

本文的目标是在一个大规模的数据集上对DETR的transformer进行无监督预训练,并将目标作为下游任务进行处理。然而,现有的pretext任务大多是基于图像实例和聚类的学习,不适用于目标检测。因此,本文提出了一个新的用于目标检测的pretext任务——随机查询patch检测。从给定的图像中随机裁剪多个查询patches,并采用无监督的方式对transformer进行预训练,以预测给定图像中查询patches的bounding box。预训练过程中主要有两个问题:多任务学习和多查询定位。

2024-03-14 10:15:00 1766

原创 【ResNet50网络复现遇到的问题】

ResNet网络复现遇到的一点小bug

2024-03-13 20:06:43 605 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除