历史图像与文本处理:从拜占庭铭文到庞贝古城资料
1. 四元数生成对抗网络用于拜占庭纪念碑铭文检测
1.1 模型对比
在铭文检测任务中,研究人员提出了使用四元数值神经元和权重的生成对抗网络(QGAN)的新变体,并将其与具有相同神经元数量的非四元数对应模型(VGAN)进行了比较。
| 模型/网络类型 | 标准 | 大型 |
| — | — | — |
| 四元数生成对抗网络(QGAN) | 6.54(45.4%) | 6.91(44.9%) |
| 普通生成对抗网络(VGAN) | 7.4(51.9%) | 6.45(52.0%) |
表格中的测试BCE数字越低越好,对应的IoU分数(括号内)越高越好。从数据可以看出,两种模型在不同规模下各有优劣。
同时,研究还对比了两种模型的大小,以可训练权重的数量来衡量。
| 模型/网络类型 | 标准 | 大型 |
| — | — | — |
| 四元数生成对抗网络(QGAN) | 381,426 (1,525,704) | 1,516,514 (6,066,056) |
| 普通生成对抗网络(VGAN) | 6,053,826 | 24,166,274 |
括号内为等效实权重的数量,方便比较两种变体的存储大小要求。可以明显看出,QGAN在模型大小上远小于VGAN。
1.2 模型优势
该提出的模型是一个条件GAN,生成器接受彩色输入图像并输出检测热图。四元数值网络能够固有地处理颜色相关性表示。在拜占庭纪念碑铭文检测任务中,铭文本身颜色变化不大,但非铭文元素(如壁画、绘画)颜色变化较
超级会员免费看
订阅专栏 解锁全文
243

被折叠的 条评论
为什么被折叠?



