6、艺术数据分类：挑战与误区

最新推荐文章于 2025-11-15 11:19:39 发布

QuietPulse

最新推荐文章于 2025-11-15 11:19:39 发布

阅读量27

点赞数

CC 4.0 BY-SA版权

分类专栏：计算形式主义：艺术与AI的边界文章标签：艺术数据分类数据偏差图像选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c2d3e4f/article/details/152357722

计算形式主义：艺术与AI的边界专栏收录该内容

16 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

艺术数据分类：挑战与误区

1. 数据偏差与图像选择

在艺术图像研究中，即使纳入全球博物馆的所有图像数据，仍存在固有偏差，数据本身才是阻碍研究的关键因素。

1.1 数据集的发展

2015 年，罗格斯大学的 Elgammal 研究小组使用了带有众包元数据的 WikiArt 艺术数据库，该数据集包含 1119 位艺术家的 81449 张图像，远大于之前此类机器视觉实验所用的数据集。例如，2014 年发布的 Painting - 91 数据集仅包含 91 位艺术家的 4266 张图像。后续研究更是编译了数十万甚至数百万个样本的数据集。

1.2 图像选择的问题

在 2015 年大型艺术数据集进入计算机视觉和机器学习研究之前，图像收集和选择的描述往往模糊不清。作者常称从“互联网”获取图像，却不说明选择哪些艺术家和时间段及其原因。大部分研究试图从西方经典绘画数据集中提取风格类别，即便有少量研究涉及非西方艺术风格，但在纳入类别时也缺乏批判性思考。例如，Saleh 和 Elgammal 的研究中，将日本浮世绘与西方艺术类别混在一起；还有研究纳入澳大利亚土著艺术类别。这些非西方风格因形式属性差异，在预测中准确率更高。

1.3 选择二维绘画的原因

计算机科学研究多选择二维绘画作为实验对象，且主要是传统绘画，而非数字原生技术创作的图像。研究中常假定数字复制品能完全代表原作，尽管复制品可能分辨率低，缺少原作的纹理、颜色等细节。为使系统更具鲁棒性，研究常使用不同质量、大小、裁剪和分辨率的图像。

1.4 图像来源的影响

对于计算机科学家而言，数据集图像的一致性并非总是理想的，

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。