最近在做knowledge graph相关的research,FB15k-237是KG经常用到的一个数据集。因为项目需要,想找FB15k-237中entity id对应的实体具体是什么,但Google关停Freebase后,查询实体id的API也无法使用了。墙内没有翻到靠谱的答案,看到stackoverflow上一个比较好的回答,总结如下:
-
https://developers.google.com/freebase/#freebase-wikidata-mappings
Google提供了2.1M实体的dump,可以查到freebase实体id到wikidata实体的映射。映射数据以RDF格式储存,gzip压缩。每组Triple第一个元素为freebase地址,第三个元素是对应的wikidata地址,暂不知道第二个元素是什么,知道的小伙伴欢迎share。
如果要找FB15k-237数据集中找到一个entity id为/m/027rn的实体mid
Step1.在mapping daata中找到<http://rdf.freebase.com/ns/m.027rn>对应的Triple
Step2.找到Triple的第三个元素<http://www.wikidata.org/entity/Q786>
Step3.浏览器打开网址http://www.wikidata.org/entity/Q786
即可找到/m/027rn对应的实际实体是Dominican Republic -
http://sameas.org/
http://sameas.org/提供了部分其他的freebase实体映射,这个途径没有试过,感兴趣的同学可以试试。 -
其他
除以上数据外,还有约1-5k的mid我们没办法对应到实际实体名称。
参考:
https://stackoverflow.com/questions/41236503/entity-name-not-found-by-its-mid-in-freebase