探索信息检索前沿:IRFC 2014 会议亮点与瑞典专利文本 OCR 纠错研究
2014 年 11 月 10 - 12 日,丹麦哥本哈根举办了第三届开放跨学科 MUMIA 会议和第七届信息检索设施会议(IRFC2014)。此次会议由哥本哈根奥尔堡大学传播系和 IC1002 COST 行动多语言和多方面交互式信息访问(MUMIA)组织,并得到了英国计算机协会信息检索特别兴趣小组的认可。会议收到了来自十个不同国家的 13 份高质量投稿,其中十篇被接受为全文论文,一篇为行业论文,每篇投稿都由三名程序委员会成员评审。
会议论文研究方向
会议涵盖了广泛的主题,从信息检索(IR)的基础问题到特定领域的应用以及 IR 系统的评估。以下是部分论文的研究方向:
1. 基于内容的图像检索(CBIR) :Hasmik Osipyan 等人提出了一种基于 GPU 架构的快速交互式 CBIR 界面,通过快速 k - 均值聚类和新的快速 SBMDS 实现,使用玛雅象形文字标准数据集评估,证明了其在交互速度上的有效性,且 GPU 架构的 SBMDS 算法性能优于 CPU 和现有 GPU 算法。
2. 数据对象图遍历 :Serwah Sabetghadam 等人探讨了如何“智能”遍历数据对象图,探索它们之间的关联。
3. OCR 错误纠正 :Linda Andersson 等人比较了两种用于纠正瑞典文本中光学字符识别(OCR)错误的基本后处理算法,旨在提高 OCR 生成的瑞典专利文本质量。
4. 纳米出版物提取 :Aldo Lipani 等人