图像篡改常用数据集casia

摘自论文 CASIA IMAGE TAMPERING DETECTION EVALUATION DATABASE

2013年发表的论文。

CASIA 数据集是Institute of Automation, Chinese Academy of Sciences 国人所作,中科院自动化研究所。

以下内容是瞎猜的

Chinese Academy of Sciences , 估计CAS是这个的缩写。

而这个IA可能是这个。不明原因,iA这个词就有只能自动的含义。
在这里插入图片描述
所以就是CASIA = CAS + IA=中科院 自动化

就图像篡改数据集而言,是相对其他任务更加容易获得的,单张篡改图像的制作难度很低,但是多样的篡改数据,适合训练的篡改数据难以制作。但是制作数据集的难度还是比较低的。所以会有不少人自己做数据集训练。

CASIA 和Columbia

在这里插入图片描述

CASIA v2.0

在这里插入图片描述

CASIA v1.0

在这里插入图片描述

交叉验证

在这里插入图片描述

比较Columbia 优势

  • CASIA 比Columbia的篡改质量明显高,标注也比较准确。
  • Columbia对于边缘的标注有明显的像素偏差,做篡改边缘检测的最好不要用它。
  • Columbia被人眼识别篡改的概率是100%,说明篡改的质量低,不符合实际的应用场景。

就有一些论文,喜欢在Columbia里面测试,还说什么act very well in Columbia,结果展示还只放这个数据集的图。这个测试其实意义不大,如果人一眼就看出来,那为什么还要机器呢。

数据集特点

  • 所有的图像都是人为的通过PS制作的,要求符合人眼的习惯。
  • 可以是splicing或者copy-move 的篡改,即可以是同图,或者不同图
  • 裁剪后的图像区域可以通过缩放、旋转或其他失真操作,然后粘贴生成拼接图像。在生成拼接图像后,可以使用像模糊这样的后期处理。模糊/过滤可以沿着篡改区域定制或生成图像中的任何其他地方应用
  • 包含不同的篡改面积
  • 定义边缘是随机的,合理的。并非是固定的规则几何形状。
  • 包含一些纹理的混淆项,对检测而言是困难样本

数据集链接

论文中数据集链接,已测试,无法连接,像是外网网址。

The databases are now availiable online at http://forensics.idealtest.org/

改用其他途径,可以轻松搜索到

### 图像篡改数据集及相关信息 #### 数据集概述 在IT领域,图像篡改的研究依赖于高质量的数据集支持。这些数据集不仅提供了丰富的样本用于算法训练和验证,还推动了学术界和技术界的进步。以下是几个重要的图像篡改数据集: - **ForgeryNet 数据集**是一个大规模的人脸伪造数据集,其特点在于图像和视频级别均具有统一的注释[^2]。此数据集适用于多种任务,包括但不限于检测拼接、复制移动以及去除等类型的篡改。 - 另外,Zlatkova等人提出的事实核查数据集专门设计用来评估图像真实性声明的技术方法[^3]。尽管它可能更侧重于新闻或社交媒体场景下的应用,但对于理解图像篡改背后的社会影响同样重要。 #### 篡改类型与挑战 根据已有研究,图像篡改可以分为三类:拼接、复制移动和去除[^4]。每种类型都带来了独特的技术和理论上的难题。例如,在处理复制移动时,需要特别注意纹理重复性和几何一致性;而面对去除操作,则需考虑背景重建的真实度等问题。 #### 实践中的考量因素 对于实际竞赛或者项目实施过程中,提交成果的形式也有严格规定。比如某些比赛要求参赛者按照特定结构整理并上传含有预测掩码(mask) 的ZIP文件夹,其中包含4000张PNG格式图片,并且要确保路径正确无误以便系统能够自动化评分流程[^5]。 通过上述描述可以看出,无论是基础科学研究还是工业级解决方案开发,优质且多样化的数据资源都是不可或缺的一部分。它们为构建更加精准有效的防伪模型奠定了坚实的基础。 ```python # 示例代码展示如何读取一张 PNG 文件作为 Mask 输入给定目录下所有文件名列表 import os from PIL import Image def load_masks_from_directory(directory_path): mask_images = [] for filename in os.listdir(directory_path): if filename.endswith(".png"): img_path = os.path.join(directory_path, filename) with Image.open(img_path) as im: mask_images.append(im.convert('L')) # 转换为灰度模式 return mask_images ```
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值