基于XML的异构互联网资源无缝访问中介框架
1. 引言
互联网已成为最大的数据库,但其中的内容存储格式多样。例如,生物学家访问单核苷酸原型(SNP)数据库时,数据可能以XML、平面文件、MySQL或ASN.1格式存在。访问这些内容的主要问题是异构性,每个站点都有自己的语义、结构、模式和数据模型,访问需要大量手动工作。
为解决这一问题,实现对异构互联网资源的无缝访问,需要整合信息资源并支持单一格式的查询。目前有多种整合方法,如通用DBMS方法、联邦数据库、数据仓库、多数据库和中介方法。其中,中介方法适用于整合非结构化、半结构化和结构化数据,而其他方法主要用于整合通常存储在DBMS中的结构化异构数据。
XML被引入作为中介的通用数据模型,它支持具有不同查询方法、数据表示和模式结构的信息资源的查询处理。与面向对象数据模型、基于规则的数据模型和半结构化数据模型相比,基于XML的通用数据模型具有易于建模、可读性高、文档传输中无需冗余编码或解码处理以及在互联网环境中自然等优点。
本文提出了一种名为XMF(基于XML的中介框架)的新方法,用于整合互联网信息资源。XMF采用中介 - 包装器架构,为最终用户提供底层信息源的集成视图。与MIX相比,XMF在查询处理上更快,因为它提前整合数据,而MIX在查询处理结果中整合数据。此外,XMF使用标准查询语言Xpath,更适合互联网环境。
XMF具有以下三个特点:
- 用XML描述信息资源和映射规则,解决模式冲突问题,支持各种信息资源的整合和全局模式信息的动态管理。
- 包装器支持HTTP和JDBC等知名协议。
- 使用Xpath作为查询语言,因为XMF的集成结果是XML文档。
超级会员免费看
订阅专栏 解锁全文
9666

被折叠的 条评论
为什么被折叠?



