6、艺术数据分类:挑战与误区

艺术数据分类:挑战与误区

1. 数据偏差与图像选择

在艺术图像研究中,即使纳入全球博物馆的所有图像数据,仍存在固有偏差,数据本身才是阻碍研究的关键因素。

1.1 数据集的发展

2015 年,罗格斯大学的 Elgammal 研究小组使用了带有众包元数据的 WikiArt 艺术数据库,该数据集包含 1119 位艺术家的 81449 张图像,远大于之前此类机器视觉实验所用的数据集。例如,2014 年发布的 Painting - 91 数据集仅包含 91 位艺术家的 4266 张图像。后续研究更是编译了数十万甚至数百万个样本的数据集。

1.2 图像选择的问题

在 2015 年大型艺术数据集进入计算机视觉和机器学习研究之前,图像收集和选择的描述往往模糊不清。作者常称从“互联网”获取图像,却不说明选择哪些艺术家和时间段及其原因。大部分研究试图从西方经典绘画数据集中提取风格类别,即便有少量研究涉及非西方艺术风格,但在纳入类别时也缺乏批判性思考。例如,Saleh 和 Elgammal 的研究中,将日本浮世绘与西方艺术类别混在一起;还有研究纳入澳大利亚土著艺术类别。这些非西方风格因形式属性差异,在预测中准确率更高。

1.3 选择二维绘画的原因

计算机科学研究多选择二维绘画作为实验对象,且主要是传统绘画,而非数字原生技术创作的图像。研究中常假定数字复制品能完全代表原作,尽管复制品可能分辨率低,缺少原作的纹理、颜色等细节。为使系统更具鲁棒性,研究常使用不同质量、大小、裁剪和分辨率的图像。

1.4 图像来源的影响

对于计算机科学家而言,数据集图像的一致性并非总是理想的,

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值