基于 XML 的知识发现数据库:原理、应用与展望
1. 概念架构与数据处理
在知识发现的领域中,基于 XML 的数据库系统有着独特的架构设计。实例描述了给定操作符的输入角色,并与某些数据项类相关联,输出角色也有类似的情况。概念架构的上半部分描述了数据项(即数据类的实例)和语句(即操作符的应用)。关系 Operator_Instance 和 Class_Instance 分别将每个语句和数据项与特定的操作符和数据类关联起来。三元关系 Input_Item 表示每个语句中每个输入数据项所扮演的角色, Output_Item 也是如此,不过数据项一侧的基数约束为 (0:1),因为初始数据项不是由任何工具生成的,而派生数据项只能由单个语句生成。
数据项存在一个层次结构,对于物化数据项,属性 Filename 表示包含 XML 数据项的文件名称。采用文件系统作为系统的存储支持,对于内容庞大的数据项尤为有用,但用户层面看不到对数据项文件名的引用,他们并不了解系统底层的实现细节。此外,这个层次结构是完全且互斥的,即一个数据项要么是物化的,要么是虚拟的。
2. 系统处理与数据访问
XDM 系统允许轻松添加新的操作符,前提是它们实现了定义明确的接口。操作符的实现负责实现赋予操作符的实际语义。XDM 管理器为操作符提供对输入数据项的访问服务,并获取输出数据项。
在数据挖掘中,处理大数据集时,通信通道是关键因素。为了解决这个问题,系统实现了一个特定的类来访问数据项,而无需在主内存中构建文档的表示,因为像 DOM
基于XML的知识发现数据库:原理与展望
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



