文化遗产影像处理与分析:从图像分类到颜料映射
1. 数据收集与准备
在文化遗产研究中,数据的收集和准备是后续分析的基础。研究人员收集了相关图像数据以及与之正确关联的说明文字。具体来说,从特定资源中收集了所有图像数据,并从第二卷中获取了 1370 条与图像正确关联的说明文字,同时排除了因 OCR 错误而收集错误的说明文字以及不正确的图像 - 说明文字索引对。
2. 图像相似度分析
2.1 特征提取与分类
为了分析图像之间的相似度,研究人员采用了迁移学习方法。首先使用在 ImageNet 数据集的 1000 个类别上预训练的 Inception V3 模型,对第二卷中的图像进行处理,为每个图像生成一个长度为 1000 的特征向量。接着,使用 K - 最近邻(KNN)算法将这些图像分为 10 个类别,具体分类结果如下:
| 类别编号 | 图像数量 | 类别描述 |
| ---- | ---- | ---- |
| 0 | 183 | 大多为废墟的黑白图像 |
| 1 | 52 | 包含方形结构的壁画 |
| 2 | 69 | 具有矩形形状(垂直或水平)的长墙 |
| 3 | 386 | 地图、示意图和复杂形状 |
| 4 | 47 | 黑白特写,有飞行的人或动物 |
| 5 | 62 | 圆形特写 |
| 6 | 79 | 人物和动物的表现 |
| 7 | 30 | 动物和天使 |
| 8 | 274 | 大墙 |
| 9 | 259 | 大空间 |
从分类结果来看,这些特征向量可作为描述向量用于图像的进一步分析。为了在
超级会员免费看
订阅专栏 解锁全文
2201

被折叠的 条评论
为什么被折叠?



