Marquez,开源的元数据管理工具

Marquez是一款由WeWork发布并开源的元数据服务,用于数据生态系统元数据的收集、汇总及可视化,支持数据血缘、治理和健康检查等功能。它通过RESTful API与Airflow、Amundsen和Dagster等系统集成,提供集中式元数据管理和数据发现服务。

Marquez是一款开源的元数据服务,用于数据生态系统元数据的收集、汇总及可视化。它维护着数据集的消费和生产,为作业运行时和数据集访问频率提供全局可见性,提供集中的数据集生命周期管理等。WeWork发布并开源了Marquez。

Marquez的特征:

  • 集中式元数据管理支持:

           数据血缘(Data Lineage)

           数据治理(Data governance)

           数据健康检查(Data health)

 数据发现+探索(Data discovery + exploration)

  • 精确的高维度数据模型:

           作业(Jobs)

           数据集(Datasets)

  • 通过指定的元数据 API轻松收集元数据:

           重视数据集数据

           强化作业和数据集的所有权

  • 以最小的依赖进行简单的操作和设计

  • RESTful API支持与其他系统的复杂集成:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值