图像拼接检测与音频驱动的人工视频面部合成技术解析
图像拼接检测方法
在图像拼接检测领域,存在多种基于特征提取和机器学习或深度卷积神经网络的方案。以下是一些常见方案的详细介绍:
| 提出的方案 | 操作基础 | 探索的数据集 | 实验结果 |
| — | — | — | — |
| 基于QDCT中的马尔可夫特征 | 扩展的QDCT马尔可夫特征 | CASIA V1.0,CASIA V2.0 | 准确率92.38% |
| 基于LBP和DCT | LBP、2D - DCT和色度分量 | CASIA TIDE v1.0和v2.0,Columbia | 准确率分别为97%、97.5%和96.6% |
| 基于Mask - RCNN和ResNet - Conv | Mask - RCNN、ResNet - Conv、迁移学习 | COCO数据集 | AUC分数为96.7% |
| 基于WPIC和CNN | WPIC和CNN | NIST MFC18和DSO - 1 | AUC分数为76% |
| 基于照明图和CNN | 照明图、CNN、ResNet - 50、RGB梯度 | DSO - 1、DSI - 1、Columbia | 准确率96% |
| 基于局部特征描述符和深度CNN | 局部特征描述符、深度CNN、CRF、特征融合 | DSO - 1、Columbia灰度DVMM和CASIA v 2.0 | 准确率97%,AUC分数99% |
从这些方案中可以看出,基于深度学习的方法通常比基于特征提取的方法具有更高的准确率,但它们需要大量的训练数据,成本相对较高,并且训练过程耗时且复杂。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



