数据库、语义网与链接数据:技术演进与应用探索
1. 数据库发展历程
20世纪60年代,人工智能社区逐渐形成,与此同时,数据领域也有了重要发展。当时,美国国家航空航天局(NASA)为了管理阿波罗项目中火箭部件及其供应商信息,开发了一种层次文件系统。1966年,IBM基于该文件系统构建了信息管理系统(IMS),这种层次模型以树状形式存储数据。几乎同一时期,通用电气的查尔斯·巴赫曼(Charles Bachman)提出了网络模型,并在集成数据存储(IDS)中实现,该模型以图状形式存储数据。
这两种导航式数据库模型有一些关键特点。程序一次只能访问一个数据库元组,这就需要编写大量嵌套循环,查询性能很大程度上取决于程序员。例如,IMS甚至没有对存储实现进行抽象,针对不同数据结构需要编写不同的循环。这种紧密耦合虽然能高效访问数据,但数据库结构的微小变化都可能导致应用程序需要重新编程。
1970年,IBM的数学家埃德加·F·科德(Edgar F. Codd)为实现数据独立性,提出了关系模型。该模型将数据库的逻辑表示与物理实现分离,数据存储在简单的数据结构(关系,即表)中,数据库操作基于关系级别而非元组级别,可同时处理多个元组。操作通过基于集合运算的关系代数进行形式化,并可以使用高级声明性语言(如SQL)进行查询。SQL成为美国国家标准协会(ANSI)标准后,关系模型逐渐取代了层次和网络等导航式模型。
关系模型将数据存储在元组中,元组是将属性名映射到值的部分函数,关系由表头(有限的属性名集合,即列)和表体(所有以表头为定义域的元组集合)组成。
然而,随着面向对象编程的兴起,开发者发现面向对象范式与关系模型之间存在不匹配的问题。复杂对象难以直接存储在关系数据库
超级会员免费看
订阅专栏 解锁全文
2234

被折叠的 条评论
为什么被折叠?



