第一章 数据库基础知识
数据
狭义:数值数据
广义:文字、声音、图形等一切能被计算机接收且能被处理的符号
数据库的特点
存储大量数据,方便检索和访问
保持数据信息的一致、完整
共享和安全
通过组合分析,产生新的有用信息
数据库管理软件
管理大量的、持久的、可靠的、共享的数据的工具
数据管理技术的发展
-
人工管理阶段
缺陷:
-
没有专用的软件对数据进行管理。
-
数据的组织方式必须由程序员自行设计与安排。
-
只有程序的概念而没有文件的概念、数据面向应用,也就是一组数据只能对应一个程序。
-
-
文件管理
缺陷:
-
数据冗余性
-
数据不一致性
-
数据联系弱
-
-
数据库管理
数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象。
数据库
所谓数据库(Database,DB),是将数据按一定的数据模型组织、描述和存储,具有较小的冗余度,较高的数据独立性和易扩展性,并可为各种用户共享的数据集合。
关系型数据库
关系模型使用的存储结构是多个二维表格,表中每一行称为一条记录,用来描述一个对象的信息;每一列称为一个字段,用来描述对象的一个属性。数据表于数据库之间存在相应的关联,这些关联将用来查询相关的数据。
数据库管理系统
数据库管理系统(DBMS-DataBase Management System)对收集到的大量数据进行整理、加工、归并、分类、计算、存储等处理,产生新的数据,以便反映事物或现象的本质和特征及其内在联系。
数据库系统的基本概念
应用程序
- 作用:响应操作并显示结果、向数据库请求数据。
- 要求:美观、操作简单方便。
数据库
- 作用:存储数据、检索数据、生成新的数据。
- 要求:统一、安全、性能等。
数据库系统
数据库系统(Database System, DBS)一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户结构组成。
结构化查询语言SQL
-
SQL语言是用于关系数据库查询的结构化语言,最早由Boycei和Chambedin在1974年提出,称为SEQUEL语言。1976年,IBM公司的San Jose研究所在研制关系数据库管理系统System R时修改为SEQUEL2,即目前的SQL语言。
-
SQL语言集数据查询(data query)、数据操纵(data manipulation)、数据定义(data definition)和数据控制(data control)功能于一体,充分体现了关系数据语言的特点和优点。
-
主要特点包括:
- 综合统一
- 高度非过程化
- 面向集合的操作方式
- 以同一种语法结构提供两种使用方式
- 语言简洁,易学易用
大数据时代的数据库管理系统
- SQL-关系型数据库管理系统(RDBMS)
- 不同的角色(开发者,用户,数据库管理员)使用相同的语言。
- 不同的RDBMS使用统一标准的语言。
- SQL使用一种高级的非结构化查询语言。
- 坚持ACD准则(原子性,一致性,隔离性,持久性)。
- NoSQL-非关系性数据库
- 采用Key-value方式存储数据。采取最终一致性原则,更加适合互联网数据,但这 也可能导致数据丢失。
- NewSQL-结合SQL和NoSQL
- 将SQL的ACID保证与NoSQL的可扩展性和高性能相结合,目前大多数NewSQL数 据库都是专有软件或仅适用于特定场景,这显然限制了新技术的普及和应用。
主流数据库产品
- Oracle
- Oracle公司的产品,世界上最好的数据库系统
- “关系-对象”型数据库
- 支持70多种操作系统,配置、管理和维护复杂
- 主要满足对银行、金融、保险等企业、事业开发大型数据库需求
- MySQL
- 瑞典MySQLAB公司开发,现在MySQL并入了Oracle旗下
- 体积小、速度快、成本低、开放源码
- 广泛地应用在Internet上的中小型网站中
- SQL Server
- Microsoft公司的产品,针对不同用户群体的多个版本
- 要求在Windows操作系统平台上运行
- 易用性好