XML数据集成与DTD转换的技术解析
1. XML数据集成的DIXSE框架
在当今的Web环境中,XML作为半结构化和结构化数据表示与交换的通用标准,其数据集成问题备受关注。DIXSE(一种语义框架)为XML数据集成提供了有效的解决方案。
DIXSE系统基于数据仓库方法进行数据集成,采用ConceptBase作为存储机制,这是一个实现了Telos语言版本的对象库管理系统。该系统由Java 2实现,主要包含两个子系统:
- Schema Engine :允许用户将XML DTD注册到存储库中。它包含五个组件,分别是DTD解析器、XML解析器、Schema Derivator、Schema Generator和XSL Wrapper Generator。
- Document Loader :允许用符合已注册DTD的XML文档集合填充存储库,由XSL Processor和Data Integrator组成。
两个子系统之间通过Catalog Manager和XSL Wrapper Repository进行通信。
在处理XML文档时,存在一些问题。例如,从XML描述中得到的默认集成概念模式,若多个XML文档中有相同的作者姓名,不会被视为同一对象,每次上传带有作者元素的XML文档时都会创建新的Author令牌。为克服这些不足,需要通过DIXSE映射规范提供额外的领域知识。改进后的用户自定义集成概念模式能更好地模拟SIGMOD Record XML文档所代表信息的预期解释和使用,为数据集成提供更好的指导。其特点包括:使用有意义的实体类和属性名、区分不同类型的SIGMOD Re
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



