开源项目推荐:Cloud Data Quality

开源项目推荐:Cloud Data Quality

cloud-data-quality Data Quality Engine for BigQuery cloud-data-quality 项目地址: https://gitcode.com/gh_mirrors/cl/cloud-data-quality

Cloud Data Quality 是由 GoogleCloudPlatform 提供的一个开源项目,该项目主要使用 Python 编程语言,同时也涉及 Shell、Starlark 和 Makefile 等语言。

项目基础介绍

Cloud Data Quality 是一个云原生、声明式且可扩展的数据质量验证命令行界面(CLI)应用程序,专为 Google BigQuery 设计。它允许用户定义和调度针对 BigQuery 表格的定制数据质量检查。数据质量验证结果将存储在用户选择的另一个 BigQuery 表格中,用户可以在此基础上构建仪表板或以编程方式使用数据质量输出,从而监控数据质量和数据管道。

核心功能

  • 声明式规则配置:支持 CI/CD 的声明式规则配置,使得数据质量检查易于定义和维护。
  • 就地验证:不需要提取数据,可以直接在 BigQuery 原生表和通过 BigQuery 外部表访问的 GCS 结构化数据上进行验证,利用 BigQuery 的性能和可扩展性,同时最小化安全风险面。
  • 验证结果:验证结果端点设计用于编程消费,持久化存储在 BigQuery 中,并提供 Cloud Logging 池,允许与 BI 报告和元数据管理工具进行自定义集成。

最近更新的功能

根据项目的最新更新,以下是一些新增的功能和改进:

  • 优化了构建和部署流程:通过更新构建脚本和部署流程,提高了项目的易用性和可维护性。
  • 增加了示例和文档:项目文档和用户手册得到了更新,提供了更多的示例和使用案例,帮助用户更好地理解和使用 Cloud Data Quality。
  • 改进了错误处理和日志记录:增强了错误处理和日志记录功能,使得问题诊断和调试更为高效。

Cloud Data Quality 作为一个开源项目,不断吸收社区贡献,致力于提升数据质量检查的自动化和智能化水平,是一个值得关注和使用的项目。

cloud-data-quality Data Quality Engine for BigQuery cloud-data-quality 项目地址: https://gitcode.com/gh_mirrors/cl/cloud-data-quality

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

徐含微

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值