Richpedia: A Large-Scale, Comprehensive Multi-Modal Knowledge Graph
一、Richpedia是一个图像多模态知识图谱,顾名思义实体分为了文本实体和图像实体,由这些实体构成三元组。论文介绍了Richpedia的建立过程,包括了数据收集、图像处理和关系挖掘。

图1 构建流程
1、数据收集:
text实体来自Wikipedia,图像是通过Google,Yahoo和Bing来搜索text实体爬取的。Wikipedia中每个实体包含了唯一的IRI,文中提到将这些IRI添加到Richpedia,而非实体本身。最终一共收集了20638个关于城市、景点和名人的实体。(这里用IRI的原因就是为了后期使用的时候可以直接在Wikipedia上查询)
&nbs

最低0.47元/天 解锁文章
612

被折叠的 条评论
为什么被折叠?



