CRAWLER - LD:用于链接数据的多级元数据聚焦爬虫框架解析
1. 资源查找的挑战与本体推荐方法
在资源查找过程中,标签值可能不准确、使用其他语言或只是所需词汇的同义词,且不能对模式及其关系进行妥协,因此找到不相关资源的风险较高。Martínez - Romero 等人提出了一种基于三点的本体自动推荐方法:
1. 本体与关键词集的匹配程度。
2. 所找到本体的语义密度。
3. 三元组集在 Web 2.0 上的流行度。
他们还通过一个复杂的过程将一组关键词与资源标签值进行匹配。CRAWLER - LD 可作为推荐工具的一个组件,用于在数据库三元化过程中定位合适的本体,以及找到与给定三元组集进行链接的三元组集,但它并非设计为完整的推荐工具,而是作为此类系统的一个组件。
2. 链接数据基础技术
2.1 RDF、RDF Schema 和 OWL
链接数据原则倡导使用 RDF、RDF Schema 和其他技术来标准化资源描述。
- RDF :通过 (s, p, o) 形式的三元组描述资源及其关系,其中 s 是三元组的主题(RDF URI 引用或空白节点),p 是谓词或属性(RDF URI 引用,指定 s 和 o 的关系),o 是对象(RDF URI 引用、文字或空白节点),三元组也可表示为 “
”。
- RDF Schema :是 RDF 的语义扩展,用于描述资源的类和属性。
- OWL :进一步扩展了 RDF Schema,
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



