概述-元数据是什么?

元数据不仅是描述数据的数据,包括表结构、字段信息等,还涉及任务管理和运维数据。广义的元数据涵盖表结构、文件信息、任务详情、实例状态、访问记录和工具使用等,对于数据团队的管理、优化和效率提升至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

元数据是什么?

元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。—— 百度百科

元数据就是描述数据的数据。
按照百度百科的描述前一个数据应该是指数据仓库中的各种表里的数据,即业务相关数据。后一个数据应该是指表结构、表对应的HDFS里的文件信息。
如果有自建的开发工具,应该还包括表字段的一系列配置属性,如描述、是否废弃、是否枚举字段、安全等级等等。

提到元数据的人都说元数据管理非常重要,但如果元数据只是描述数据的数据,我感觉不到它的重要性体现在哪里?
因为这些数据确实很有用,但更多是用在查询了解数据内容和含义的时候。比如技术在做需求的时候,运营在使用数据的时候。要去了解数据放在哪里,表结构什么样子,字段含义怎样。

实际工作中还有很多非常重要的数据,既不属于业务数据,又不属于这个定义里的元数据。
比如数据任务相关的一些信息,任务实例相关的信息,各种各样的工具和非业务系统的应用产品的操作日志等等。
如果百度定义的元数据是解决查询的问题的,那么管理、运维、优化这些工作用到的数据,就没有包含在里面。

我个人认为广义的元数据应该是在数据的生产、维护、管理、使用的过程中需要用到的&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值