Where is My URI?:高效定位 URI 数据源的解决方案
1. 背景与动机
在语义网和关联数据的应用中,定位 URI 首次定义的数据集是一项耗时的任务,这极大地影响了许多语义网应用的可扩展性和时间效率,如链接发现、关联数据丰富和联邦查询处理等。然而,URI 的来源信息对于跨数据集的链接再生和验证至关重要。目前,提供此类信息的现有服务的可用性是语义网和关联数据面临的关键问题之一。约 90% 以关联开放数据形式发布的信息仅以数据转储形式提供,超过 60% 的端点处于离线状态,这主要是由于存储和提供查询服务的成本较高。
2. 解决方案:Where is my URI? (WIMU)
为解决上述问题,我们提出了 WIMU,这是一种低成本的语义网服务,用于确定 URI 的 RDF 数据源及其使用情况。该服务还会对数据源进行排名,其排名基于一个评分函数。目前,该服务已处理了来自 LODStats 和 LOD Laundromat 的超过 660,000 个数据集的超过 580 亿个唯一三元组。对于每个 URI,服务会提供相应的数据集以及数据集中包含该 URI 的文字数量。服务既可以通过 Web 界面使用,也可以通过标准 HTTP 协议从客户端应用程序进行查询。
2.1 主要贡献
- 提供一个定期更新的数据库索引,包含来自 LODStats 和 LOD Laundromat 的超过 660K 个数据集。
- 在 Web 上提供一个高效、低成本且可扩展的服务,显示最有可能定义 URI 的数据集。
- 提供从 LODStats 和 LOD Laundromat 索引的数据集的各种统计信息。
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



