自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Vi

MOFA-Video,一种先进的可控图像利用各种附加可控信号(如人类地标参考、手动轨迹,另一个甚至提供视频)或它们的组合。这不同于以往的方法只能在视频生成流水线中工作。对于MOFA-Adapters,在给定的稀疏控制条件下,首先对视频的时间运动一致性进行分析,生成密集的运动流,将给定图像的多尺度特征作为引导特征进行包裹,以稳定地生成视频扩散。我们为手动轨迹和人类地标分别训练两个运动适配器,因为它们都包含关于控制的稀疏信息。经过培训,不同领域的MOFA-Adapters也可以共同努力,实现更可控的视频生成。

2024-10-13 11:02:57 804

原创 快手LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control

快手LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control

2024-10-13 11:01:18 899

原创 视频合成—NeurIPS2018—Video-to-Video Synthesis

在本文中,提出了一种在生成对抗学习框架下的视频到视频合成方法。通过精心设计的生成器和鉴别器,再加上时空对抗目标,我们在包括分割蒙版、草图和姿势在内的多种输入格式上实现了高分辨率、逼真、时间连贯的视频结果。

2024-06-09 11:49:46 867

原创 换脸的双重防御—2024TIFS—Dual Defense: Adversarial, Traceable, and Invisible Robust Watermarking Against Fac

一种基于鲁棒对抗性水印的创新框架。它同时跟踪图像版权,并通过一次性嵌入鲁棒对抗水印来破坏人脸交换模型。

2024-06-08 21:37:09 1310

原创 面试真题:语音特征提取方式——为何要这样提取?

语音特征提取的方式,为什么要这样提取

2024-05-26 23:24:35 917

原创 腾讯音乐TME-MuseTalk模型代码详解

MuseTalk的测试流程

2024-05-26 19:57:12 1509 1

原创 代码解析—part3 训练ADM—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake

论文代码训练模块

2024-05-23 15:16:07 1019 5

原创 代码解析—part 2 数据集加载MFS—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake

MFS模块代码解析

2024-05-22 18:44:13 897 1

原创 面试真题——self-attention 不要只记公式了!!

面试真题-手撕self-attention

2024-05-19 15:10:42 713

原创 AIGC这是我想进入就能进的吗——研二找暑期实习AIGC方向严重受挫

AIGC说的我们想进去,就真能收留我们一样,你有硬件训练吗,你有数据吗?谨慎考虑!!!别入坑了爬不出来了

2024-05-17 22:03:49 214

原创 代码解析—part1 数据准备—CVPR2023—Implicit Identity Leakage: The Stumbling Block to Improving Deepfake

代码理解

2024-05-13 00:05:13 705 2

原创 deepfake检测——Implicit Identity Leakage: The Stumbling Block to Improving Deepfake Detection Ge

在本文中,分析了二元分类器在深度伪造检测任务中的泛化能力。发现阻碍它们泛化的绊脚石是由意想不到的图像学习身份表示引起的。这种现象被称为隐式身份泄漏,基于这样的理解,我们提出了一种简单而有效的方法,以减少这种现象的影响。大量的实验结果表明,我们的方法在数据集内和跨数据集评估方面都优于最先进的方法。

2024-05-13 00:02:58 3071 2

原创 diffusion model基础学习——DDPM代码解析

本文主要梳理以训练CIFAR-10数据集【包含10个类别的60000个32x32彩色图像】为例,DDPM与DDPM+condition的pytorch代码训练流程,模型搭建过程。细节方面解释会在代码中标注释,建议先自行查看一下代码流程。

2024-05-11 10:28:56 1094 1

原创 AIGC生成论文汇总

AIGC生成论文汇总

2024-05-10 22:01:21 1179

原创 面试收获——对于Batch Normalization不要只会公式了!!!!

batch normalization 深度理解

2024-05-10 21:33:19 904

原创 AIGC论文阅读——[Visual Speech-Aware Perceptual 3D Facial Expression Reconstruction from Videos]

提出了第一种3D说话头的视觉语音感知重建方法。该方法不依赖于文本转录或音频;相反,采用了一种“唇读”损失,它指导训练过程,以增加对嘴的感知。广泛的主观和客观评估已经证实,3D重建的结果明显优于仅依赖于嘴部运动的几何损失的对应方法,以及使用直接3D监督的方法。

2024-05-09 16:25:28 2460 1

原创 WTAGRAPH: Web Tracking and Advertising Detection using Graph Neural NetworksTOC

如今,网络跟踪和广告 (WTA) 在网络上无处不在,不断损害用户的隐私。现有的防御解决方案,例如广泛部署的基于过滤器列表的阻止工具和先前研究中提出的基于替代机器学习的解决方案,在准确性和有效性方面存在局限性。在这项工作中,我们提出了 WTAGRAPH,**一种基于图神经网络 (GNN) 的网络跟踪和广告检测框架**。我们首先构造一个表示 HTTP 网络流量的属性同质多图 (AHMG),并将网络跟踪和广告检测制定为 AHMG 中基于 GNN 的边缘表示学习和分类的任务

2023-05-30 21:09:40 368 1

原创 KMP算法

KMP算法设有两个串s和t,在串s中找到一个与t相等的子串。通常把s称为目标串,把t称为模式串。在目标串s中找到了一个模式串t则模式串匹配成功,没有找到则匹配不成功。设n为串s的长度,m为串t的长度。为什么要使用KMP算法?模式匹配串是一个比较复杂的串操作,用暴力的方法来做的话,复杂度为O(m*n),但如果使用KMP算法,复杂度为O(m+n),大大提高了算法效率。从模式串t中提取出加速匹...

2019-11-11 16:21:48 169

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除