元数据概述
1.什么是元数据
元数据是关于数据的组织、数据域及其关系的信息,也就是说元数据是描述数据的数据。
举个例子:户口本的元数据。户口本上除了有姓名、身份证号、出生日期、住址、民族等信息外,还有家庭关系,如夫妻关系、父子关系、兄弟关系等,这些信息就是描述一个人的元数据,通过户口本中的元数据,不仅可以了解一个人的基本信息,还可以了解其家庭关系。再举个例子:图书馆中的元数据。图书馆都会用一个叫“图书目录”的文件夹来管理图书,图书目录包含来图书名称、编号、作者、主题、摆放位置等信息,用来帮助图书管理员管理和快速查找图书。元数据就如同图书馆的图书目录一样,能够帮助数据管理员管理数据。
元数据与数据的不同之处在于:元数据描述的不是特定的实例或记录,IT部门或业务部门都需要高质量的元数据来理解现有数据;元数据是比一般意义上的数据范畴更加广泛的数据,不仅表示数据的类型、名称、数值等信息,还提供数据的上下文描述,比如数据的所属业务域、取值范围、数据间的关系、业务规则、数据来源等。
下表用5W1H模型理解元数据
知识类型 | 定义 | 技术示例 | 业务示例 |
---|---|---|---|
Who | 谁 | 谁负责数据接口的开发 | 谁是某业务域的负责人 |
What |