数据库语义恢复与XML查询处理技术解析
1. 引言
在数据库领域,一个设计良好的数据库应配备完整、准确且最新的文档,涵盖概念模式、逻辑模式,以及对数据库管理员尤为重要的物理模式及其在数据库管理系统(DBMS)数据定义语言(DDL)中的转换。这些模式对于数据库的应用程序开发、维护和演进至关重要。然而,在许多情况下,特别是对于老旧数据库,这些文档往往过时、不完整、不准确甚至丢失。因此,数据库逆向工程应运而生,旨在重建这些文档。
2. 数据库逆向工程背景
数据库逆向工程主要包括三个过程:
- 物理模式提取 :通过解析数据库的DDL代码或分析其活动数据字典(如大多数关系系统中的系统表)来恢复数据库的物理模式。此过程能使模式的显式构造(如主键、唯一约束、外键和强制字段)可见。一般来说,该过程相对简单,但子模式(如关系视图或IMS PCB)的分析可能更为复杂,因为每个子模式都提供了全局模式的部分且通常经过细化的视图。由于DBMS对数据库的处理依赖于物理模式,所以可以认为物理模式是准确的。
- 逻辑模式重建 :该过程主要用于发现模式的隐式构造,即那些未通过显式DDL语句和子句声明的构造。在某些有利情况下,这些隐式构造已被转换为程序化的数据库组件,如SQL检查、触发器和存储过程。但大多数情况下,它们分散在应用程序代码中。恢复这些隐式构造需要精确分析各种程序代码片段,特别是数据操作语言(DML)语句。虽然程序源代码是最丰富的信息源,但数据库内容、屏幕布局、报告结构、程序执行、用户访谈以及可能过时的文档也会被分析。与物理模式不同,此过程生成的逻辑模式只能被认为是合理准确的,因为可能存在未发现的隐式构造
超级会员免费看
订阅专栏 解锁全文
1230

被折叠的 条评论
为什么被折叠?



