古代手稿图像可读性的主观评估
研究设计
为建立 SALAMI 数据集而开展的主观图像质量评估(IQA)研究,在设计时遵循了国际电信联盟相关文档的指导原则。
- 测试图像
- 图像来源 :测试图像集基于 50 个 60×60 毫米的手稿区域,每个区域有 5 张图像。这些区域来自 48 种不同手稿和 8 个语系,其中斯拉夫语(19 个)、拉丁语(13 个)和希腊语(12 个)文本占多数,此外还有两份奥斯曼文本以及亚美尼亚语、格鲁吉亚语、德语和哥特语各一份。
- 选择过程 :这些手稿区域从约 4600 页、67 本历史手稿中选取。为简化评估任务、减少遗漏文本的风险,将图像内容缩小为 60 毫米边长的正方形区域。采用半自动的随机选择和人工编辑方案,选取 50 个合适区域,确保样本来自不同手稿数量最大化、所选区域仅含单层文本,并减少人工操作的偏差。
- 处理方式 :将源多光谱图像裁剪到选定的正方形区域,并重新采样到 12 像素/毫米(或 304.8 ppi)的标准分辨率,得到 720×720 像素的图像。对每个区域,通过主成分分析生成 5 个处理后的变体作为测试图像。这样,SALAMI 数据集包含 250 张测试图像,一名参与者大约一小时可完成评估。
| 语系 | 数量 |
|---|
超级会员免费看
订阅专栏 解锁全文
110

被折叠的 条评论
为什么被折叠?



