数据为我们提供有关物体或人的信息,并且可以传输或处理。 单个值(数据)通常称为数据点。 数据是我们在项目中创建的一切——从会议录音到复杂的模型。 我们项目中的一些数据示例:
- pdf 文件(例如产品数据表),
- 发送给同事的电子邮件
- 建筑工地的照片。
- 我们模型中墙壁的防火等级。
现在让我们转向不太明显的事情。
1、结构化和非结构化数据
我们产生的数据可以是结构化的或非结构化的。 这取决于它的外观以及我们如何创建它。 让我们从定义它们之间的区别开始。
结构化数据(或数据模型)组织数据点并定义彼此之间的关系。 顾名思义,在将其放入数据存储(例如关系数据库)之前必须有一个结构。
BIM 对象就是一个很好的例子:表示墙的数据模型由定义墙的其他元素组成:厚度、长度、防火等级、材料等。要创建墙,你必须将数据放入预定义的模式(每个 数据点到相应的数据字段)。 因此,结构化数据也称为写入时模式(schema-on-write)。 结构化数据最重要的特点是查询简单性。 尽管如此,它需要努力在数据库中创建一组数据。
坦率地说,非结构化数据就是其他任何东西。 非结构化信息没有预定义的数据模型。 它以本机文件格式存储。 相应地,非结构化数据是电子邮件、图片、pdf文档、会议记录等。非结构化数据的最大优点是其创建和存储的简单性。 然而,要查询它,用户必须了解该格式如何转换为纯信息。 因此它也被称为读时模式(schema-on-read)。 建筑工地的图片没有数据模型,只有熟悉某个主题的人才能将其转化为数据,例如楼层数、使用的材料、建筑尺寸、承载元件的类型等。
下表显示了我们在建设项目中遇到的数据示例:
结构化数据 | 非结构化数据 |
---|---|
时间表 | 电子邮件 |
工程量清单 |