数据建模与公共生物数据库在医学中的应用
1. 复杂数据结构建模
复杂结构在数据建模中无处不在,从编程语言中的记录到人工智能、软件工程、数据库以及知识表示逻辑中的对象,都离不开复杂结构。通用标记语言提供的形式化方法使得指定复杂结构成为可能,这使得它们比关系数据库的数据模型更加丰富。同时,由于允许可选元素,它们也比当前对象数据库系统的数据模型更具优势。可选元素在数据库中非常有吸引力,因为它们能够表达实际数据库应用中经常出现的异常情况。
“半结构化数据”这一术语的提出,强调了在传达结构的数据框架中存在此类异常的可能性。目前,大多数关于使用标记语言进行数据建模的数据库研究都是在半结构化数据的范畴内进行的。
2. 通用标记语言的数据建模
使用通用标记语言进行数据建模是一个跨学科的研究领域,它融合了四个传统上不同的研究领域:
- 数据库
- 人工智能
- 信息检索
- 文档处理
这种融合十分有趣,因为每个领域都带来了自己的关注点、方法和理念。
2.1 来自数据库的贡献
该研究领域从数据库中获得了对声明式查询语言的兴趣,其中 SQL 是最著名的例子。声明性是一个宽泛定义的概念,在这里意味着使用此类查询语言的用户不必了解计算策略、数据在内存中的内部组织方式,也不必(或尽可能少地)关注终止问题和效率。实际上,用查询语言表达的查询会自动进行优化,这使得查询优化成为可能,从而保证了可预测的“平均效率”,这也是数据库系统备受赞赏的特性之一。此外,该领域还继承了数据库对数据结构的关注,以确保非常大的数据集能够得到高效的存储、检索和更新。反之,数据库研究本身也因对文本数据、可从 W
超级会员免费看
订阅专栏 解锁全文
81

被折叠的 条评论
为什么被折叠?



