艺术数据分类:挑战与误区
1. 数据偏差与图像选择
在艺术图像研究中,即使纳入全球博物馆的所有图像数据,仍存在固有偏差,数据本身才是阻碍研究的关键因素。
1.1 数据集的发展
2015 年,罗格斯大学的 Elgammal 研究小组使用了带有众包元数据的 WikiArt 艺术数据库,该数据集包含 1119 位艺术家的 81449 张图像,远大于之前此类机器视觉实验所用的数据集。例如,2014 年发布的 Painting - 91 数据集仅包含 91 位艺术家的 4266 张图像。后续研究更是编译了数十万甚至数百万个样本的数据集。
1.2 图像选择的问题
在 2015 年大型艺术数据集进入计算机视觉和机器学习研究之前,图像收集和选择的描述往往模糊不清。作者常称从“互联网”获取图像,却不说明选择哪些艺术家和时间段及其原因。大部分研究试图从西方经典绘画数据集中提取风格类别,即便有少量研究涉及非西方艺术风格,但在纳入类别时也缺乏批判性思考。例如,Saleh 和 Elgammal 的研究中,将日本浮世绘与西方艺术类别混在一起;还有研究纳入澳大利亚土著艺术类别。这些非西方风格因形式属性差异,在预测中准确率更高。
1.3 选择二维绘画的原因
计算机科学研究多选择二维绘画作为实验对象,且主要是传统绘画,而非数字原生技术创作的图像。研究中常假定数字复制品能完全代表原作,尽管复制品可能分辨率低,缺少原作的纹理、颜色等细节。为使系统更具鲁棒性,研究常使用不同质量、大小、裁剪和分辨率的图像。
1.4 图像来源的影响
对于计算机科学家而言,数据集图像的一致性并非总是理想的,
超级会员免费看
订阅专栏 解锁全文
655

被折叠的 条评论
为什么被折叠?



