【AVT2-DWF】Improving Deepfake Detection with Audio-Visual Fusion and Dynamic Weighting Strategies

AVT2-DWF: Improving Deepfake Detection with Audio-Visual Fusion and Dynamic Weighting Strategies

会议/期刊:IEEE SIGNAL PROCESSING LETTERS 2024
作者:
在这里插入图片描述

code:https://github.com/raining-dev/AVT2-DWF

背景

随着深度伪造方法的不断改进,伪造信息已经从单模态过渡到多模态融合,对现有的伪造检测算法提出新的挑战。 【单模态——多模态】

points

提出AVT2-DWF,一种基于动态权重融合的视听双变换器,旨在放大模态内和跨模态伪造线索,从而增强检测能力。

AVT2-DWF采用双阶段方法来捕捉面部表情的空间特征和时间动态

通过具有n帧令牌化策略编码器和音频变换器编码器的面部变换器来实现的。

<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值