数据概述

最新推荐文章于 2022-04-02 14:38:46 发布

原创最新推荐文章于 2022-04-02 14:38:46 发布 · 1.6k 阅读

0 ·

CC 4.0 BY-SA版权

hardware 专栏收录该内容

15 篇文章

订阅专栏

本文详细介绍了数据的定义，包括数据的逻辑和物理表示，强调数据类型的重要性，如原始类型、变量的数据类型以及数据结构的概念，如集合、线性结构、树形结构和图形结构。此外，还探讨了定点数和浮点数在计算机中的表示方式。

一、数据概述
1.什么是数据
数据（data）是对客观事物的逻辑归纳，是对客观事物的符号表示，用符号、字母等方式对客观事物进行直观描述。数据是进行各种统计、计算、科学研究或技术设计等所依据的数值（是反映客观事物属性的数值），是表达知识的字符的集合。数据是信息的表现形式，数据可以是连续的值，例如声音，称为模拟数据；也可以是不连续（离散）的值，例如成绩，称为数字数据。数据通信就是指传输介质把数据从一个地方向另一个地方传送。数据在传送之前需要先经过编码转变为信号才能在介质上传播。
数据是一种未经加工的原始资料。数字、文字、符号、图像都是数据。数据是客观对象的表示，而信息则是数据内涵的意义，是数据的内容和解释。信息可以离开信息系统而独立存在，也可以离开信息系统的各个组成和阶段而独立存在；而数据的格式往往与计算机系统有关，并随载荷它的物理设备的形式而改变。信息与数据是不可分离的，数据是信息的表达，信息是数据的内涵。数据本身并没有意义，数据只有对实体行为产生影响时才成为信息。
在计算机科学中，数据是指所有能输入到计算机并被计算机程序处理的符号的介质的总称，是用于输入电子计算机进行处理，具有一定意义的数字、字母、符号和模拟量等的通称。

2.什么是数据类型
数据类型是一个值的集合以及定义在这个值集上的一组操作。数据类型包括原始类型、多元组、记录单元、代数数据类型、抽象数据类型、参考类型以及函数类型。数据类型的出现是为了把数据分成所需内存大小不同的数据，编程的时候需要用大数据的时候才需要申请大内存，就可以充分利用内存。同一类型的数据，其各成分都具有相同的特性，可进行相同的操作。例如,整数、实数、复数和逻辑数，都有相同的数学特性和相同的内部表示法。
在计算机中，基于数位电子学的底层数据，都是以位元（0 或 1）表示。其中数据的最小的定址单位，称为字节（通常是八位元，以八个位元为一组）。机器码指令处理的单位，称作字长（一般为32或64位元）大部分对字长的指令解译，主要以二进制为主。
在程序设计的类型系统中，数据类型(Data type)是用来约束数据的解释。在编程语言中，常见的数据类型包括原始类型（如：整数、浮点数或字元）、多元组、记录单元、代数数据类型、抽象数据类型、参考类型、类别以及函式类型。数据类型描述了数值的表示法、解释和结构，并以算法操作，或是物件在内存中的储存区，或者其它储存装置。
变量是用来存储值的所在处，它们有名字和数据类型。变量的数据类型决定了如何将代表这些值的位存储到计算机的内存中。在声明变量时也可指定它的数据类型。所有变量都具有数据类型，以决定能够存储哪种数据。
在用高级程序设计语言书写的程序中，每一个变量、常量或表达式的值，都属于确定的数据类型。变量的所有可能取值，以及在这些值上可容许的操作，都由数据的类型在程序中显式地或隐式地规定，在程序设计语言中引进类型的概念，可以集中刻划特性、易于维护；可以区分对象和运算的抽象特性，实现有关的特性，隐蔽内部细节，可以提高可靠性和易读性。类型概念的明显特征，可以概括为：
  ①类型决定变量或表达式所能取值的集合；
  ②每一个值属于一个且仅属于一个类型；
  ③变量、常量或表达式的类型,都可以从其形式或上下义推断出来,而毋须了解运行时计算出来的具体值；
  ④每一种操作要求一定类型的操作数，并且得出一定类型的结果；
  ⑤一种类型的值及其规定的基本操作的性质，可由一组公理阐明；
  ⑥程序可利用类型概念去防止或表明程序中无意义的结构，又可用于确定在计算机中的数据表示和数据存取方法。

3.什么是数据表示
数据表示是硬件能够直接认别和处理的数据类型和格式，研究计算机硬件能够直接识别，可以被指令系统直接调用的那些数据类型。数据表示是数据类型中最常用、也是相对比较简单，用硬件实现相对比较容易的几种。
在计算机网络中，数据表示是被交换数据项的语法，传输期间采用的特定形式，计算机间整数、字符和文件的转换。
数据表示和数据结构都是数据类型的子集，确定哪些数据类型用数据表示实现，哪些用数据结构实现，实质是软硬件的主要分界之一，也是计算机系统设计中的软件与硬件的取舍问题。确定哪些数据类型用数据表示来实现的原则有：缩短程序的运行时间；减少CPU与主存之间的通讯量；这种数据表示的通用性和利用率。

4.什么是数据结构
数据结构是计算机存储、组织数据的方式，是指相互之间存在一种或多种特定关系的数据元素的集合以及该集合中数据元素之间的关系。它是研究面向系统软件，应用领域所需要处理的各种数据类型，研究这些数据类型的逻辑结构和物理结构之间的关系，并给出相应算法。数据结构有逻辑结构和物理结构。
数据的逻辑结构是对数据元素间逻辑关系的描述，一个数据结构是由数据元素依据某种逻辑联系组织起来的。数据的物理结构是数据的逻辑结构在计算机存储空间的存放形式，它包括数据元素的机内表示和关系的机内表示，是数据结构的实现形式。此外讨论一个数据结构必须同时讨论在该类数据上执行的运算才有意义,一个逻辑数据结构可以有多种存储结构，且各种存储结构影响数据处理的效率。
通常情况下，精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。数据的逻辑结构反映数据元素之间的逻辑关系，其中的逻辑关系是指数据元素之间的前后关系，包括：
①集合：数据结构中的元素之间除了“同属一个集合” 的相互关系外，别无其他关系；
②线性结构：数据结构中的元素存在一对一的相互关系；
③树形结构：数据结构中的元素存在一对多的相互关系；
④图形结构数据结构中的元素存在多对多的相互关系；
由于具体存储实现的方法有顺序、链接、索引、散列等多种，所以一种数据结构可表示成一种或多种存储结构。
数据元素的机内表示是用二进制位（bit）的位串表示数据元素。通常称这种位串为节点（node）。当数据元素有若干个数据项组成时，位串中与各数据项对应的子位串称为数据域（data field）。因此，节点是数据元素的机内表示（或机内映像）。
元素关系的机内表示分为顺序映像和非顺序映像，常用两种存储结构：顺序存储结构和链式存储结构。顺序映像借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系，非顺序映像借助指示元素存储位置的指针（pointer）来表示数据元素之间的逻辑关系。

二、定点数
定点数是计算机中采用的一种数的表示方法，参与运算的数的小数点位置固定不变。计算机中定点数常有两种表示形式，即定点整数和定点小数。小数点位固定在最后一位之后称为定点整数，小数点固定在最高位之后称为定点小数（定点小数也被用在浮点数的尾数部分）。

三、浮点数
浮点数是属于有理数中某特定子集的数的数字表示，在计算机中用以近似表示任意某个实数。具体的说，这个实数由一个整数或定点数（即尾数）乘以某个基数（计算机中通常是2）的整数次幂得到，这种表示方法类似于基数为10的科学计数法。
一个浮点数a由两个数m和e来表示：a = m × b^e。在任意一个这样的系统中，我们选择一个基数b（记数系统的基）和精度p（即使用多少位来存储）。m（即尾数）是形如±d.ddd...ddd的p位数（每一位是一个介于0到b-1之间的整数，包括0和b-1)。如果m的第一位是非0整数,m称作规格化的。有一些描述使用一个单独的符号位(s 代表+或者-）来表示正负，这样m必须是正的，e是指数。
浮点数并不一定等于小数，定点数也并不一定就是整数。所谓浮点数就是小数点在逻辑上是不固定的，而定点数只能表示小数点固定的数值。