包括:数据质量管理、元数据管理、权限管理(ranger sentry)。
CDH cloudmanager-》sentry; HDP ambari=>ranger
数据治理是一个复杂的系统工程,涉及到企业和单位多个领域,既要做好顶层设计,又要解决好统一标准、统一流程、统一管理体系等问题,同时也要解决好数据采集、数据清洗、数据对接和应用集成等相关问题。
数据治理实施要点主要包含数据规划、制定数据标准、整理数据、搭建数据管理工具、构建运维体系及推广贯标六大部分,其中数据规划是纲领、制定数据标准是基础、整理数据是过程、搭建数据管理工具是技术手段、构建运维体系是前提,推广贯标是持续保障。
首先运用方法论并结合企业实际情况,制定数据整体实施路线图。然后确定数据范围,与业务部门共同制定数据标准,标准内容包括确定分类规范、编码结构、数据模型、属性描述等。标准制定后,按照数据标准进行数据检查、数据排重、数据编码、数据加载等,建立符合数据标准和规范的数据代码库。同时应建设数据管理工具,为数据的管理提供技术支持,实现数据查询、申请、修改、审核、发布、冻结、归档等全生命周期管理。同步建立数据管理和标准管理的运维组织、管理流程、考核机制等,保证数据标准规范得到有效执行。最后统一执行数据标准规范,扩大数据标准的应用范围,实现信息系统间的互联互通及共享利用。