5、艺术数据的形态:计算机视觉与艺术史研究的碰撞

艺术数据的形态:计算机视觉与艺术史研究的碰撞

艺术数据数字化现状

自20世纪80年代起,艺术史学家就开始对大学的幻灯片库进行数字化处理,或是创建数字照片,或是对博物馆藏品的现有照片进行数字化。然而,这一过程进展缓慢,常受限于机构内技术知识的缺乏和资金的限制。

在2004年左右,西北大学艺术史系从幻灯片向数字图像的过渡仍在进行中,部分教师参与前沿数字项目,而有些教师甚至不会使用PowerPoint,仍依赖两台幻灯片投影仪进行授课。到2012年,纽约市立大学研究生中心的艺术史幻灯片库数字化完成,但该系让学生将从书籍扫描的图像数字化存入私人数据库,而非订阅艺术图像数据库ArtStor。

直到最近,艺术史领域大多数数字化项目的分割性和专有性限制了计算机科学家的使用。博物馆图像数据库虽越来越多地向公众开放,但许多仍仅供博物馆工作人员或在博物馆研究图书馆内访问,数据库后端和相关元数据很少直接向公众发布。因此,2015年前处理艺术图像的计算机视觉论文常依赖计算机科学家创建的定制数据集,这些数据集有时与现有博物馆或藏品合作创建,但更多时候只是从“互联网”收集而来。

数据集中的人类偏见问题

当代图像数据集收集和分类程序中一个令人担忧且备受批评的方面是,在客观分类的幌子下复制人类偏见。这本质上是一个元数据问题,因为它涉及到人类如何对训练集(用于训练机器学习算法识别图像的数据集)进行标记或分类。

在艺术史中,图像选择(即艺术史经典中包含的内容)长期以来一直存在问题。同时,这也是黑箱机器学习的问题,研究人员只能看到系统的输入和输出,却不知道特定算法为何做出这样的“决策”。

大多数机器学习系统在注释大规模图像集时,会为“内容”或主题生

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值