数据治理,到底治的是什么?理的是什么?
数据治理的概念
数据治理是通过系统性策略和流程对数据进行全生命周期管理的过程,其核心目标是提升数据的可用性、安全性和价值。
以数据为中心的组织将数据作为资产估值,在生命周期所有阶段进行管理,包括项目开发和持续运营阶段。为达到以数据为中心,组织必须改变将战略转化为行动的方式。数据不再被作为是流程和业务产品的附属。业务处理的目标就是为了得到高质量的数据。有效数据管理成为企业致力于通过分析获得洞察、制定决策时的高优先级事项。
人们常常混淆数据和信息技术。企业为达到以数据为中心需要进行不同以往的思考方式,要理解管理数据不同于管理TT。转型并非易事,现有文化及内部制度、关于拥有权的争议、预算、历史进留系统,都将成为建立企业级数据治理和数据管理的最大障碍。
在(DAMA)中提到 数据治理的目标是使组织能够将数据作为资产进行管理。数据治理提供治理原则、制度、流程、整体框架、管理指标、监督数据资产管理,并指导数据管理过程中各层级的活动,为达到这一目标,数据治理必须包括一下几个方面:
- 可持续发展
治理程序必须富有吸引力。它不是以一个项目作为终点,而是一个持续的过程。需要把它作为整个组织的责任。数据治理必须改变数据的应用和管理方式,但也不代表着组织要作巨大的更新和颠覆。数据治理是超越一次性数据治理组件实施可持续发展路径的管理变革。可持续的数据治理靠于业务领导、发起者和所有者的支持。 - 嵌入式
数据治理不是一个附加管理流程。数据治理活动需要融合软件开发方法、数据分析应用、主数据管理和风险管理。 - 可度量
数据治理做得好有积极的财务影响,但要证明这一影响,就需要了解起始过程并计划可度量的改进方案。
数据治理的内容
- “治”的核心内容
- 数据质量问题:治理数据的准确性、完整性、一致性和及时性,例如通过数据清洗、验证和监控等手段。
- 数据安全问题:防止数据泄露和滥用,例如通过加密、权限控制和隐私保护技术。
- 数据孤岛问题:消除部门间数据壁垒,实现跨系统数据整合与共享。
- “理”的核心内容
- 组织与流程:建立数据治理委员会,明确各部门职责(如业务部门定义数据标准,IT部门执行技术方案)。
- 标准与规范:制定数据分类、命名规则、存储格式等统一标准,例如主数据管理和元数据规范。
- 合规与审计:确保数据使用符合法律法规(如GDPR、数据安全法),并建立监控评估机制
当然也有人总结为几个方面:
- 元数据管理:元数据是关于数据的组织、数据域及其关系的信息,是描述数据的数据。元数据管理涉及元数据的收集、整合、存储、维护和发布等工作,以便为数据治理提供基础支持。
- 数据标准管理:数据标准管理旨在确保组织内部的数据遵循统一的规范和标准,包括数据格式、数据命名、数据定义等。通过制定和执行数据标准,可以提高数据的一致性和可读性,降低数据管理和维护的成本。
- 数据质量管理:数据质量管理涉及数据的准确性、完整性、一致性、及时性等方面的管理。通过制定数据质量规则、监控数据质量、识别和解决数据质量问题,可以确保数据的准确性和可靠性,提高数据的价值。
- 数据集成管理:数据集成管理负责将来自不同来源的数据进行整合和统一存储,以便为组织提供一致、准确的数据视图。数据集成管理涉及数据的抽取、转换、加载等过程,需要确保数据的兼容性和一致性。
- 主数据管理:主数据是组织内最重要的数据,如客户、产品、供应商等。主数据管理负责确保主数据的准确性、一致性和完整性,以便为组织内部的各个系统和应用提供可靠的数据支持。
- 数据资产管理:数据资产管理旨在识别、评估、保护、利用和优化组织的数据资产,以创造经济或战略价值。数据资产管理需要确保数据的可访问性、可理解性和可利用性,以便为组织的决策提供有力支持。
- 数据交换管理:数据交换管理负责不同系统或平台之间数据的传输和共享。数据交换管理需要确保数据的安全性和隐私性,同时保证数据的准确性和一致性。库表、文件和 API 接口三种共享方式。API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等。
- 数据生命周期管理:数据生命周期管理涉及数据的生成、存储、处理、使用、共享和销毁等阶段的管理。通过制定和执行数据生命周期管理策略,可以确保数据在整个生命周期中的一致性、可用性和安全性。
- 数据安全管理:数据安全管理旨在保护数据免受未经授权的访问、使用、泄露、破坏或修改。数据安全管理需要制定和执行数据安全政策、使用加密技术、实施访问控制、监控和检测数据安全事件等,以确保数据的安全性和完整性
数据治理的通用框架
数据治理框架通常包含以下核心模块 :
模块 | 关键任务 |
---|---|
战略与规划 | 制定数据治理目标、范围及优先级,与企业战略对齐。 |
组织架构 | 设立治理委员会(决策层)、数据治理办公室(执行层)及业务部门协作机制。 |
数据质量管理 | 定义质量指标(如完整性>95%)、建立数据清洗规则、实施监控工具。 |
数据安全与隐私 | 分类敏感数据(如客户信息),实施分级访问控制,定期进行安全审计。 |
技术支撑体系 | 部署元数据管理工具(如Apache Atlas)、数据目录、主数据管理系统(MDM)。 |
生命周期管理 | 从数据创建到归档/销毁的全流程管理,例如设定金融交易数据保留期为7年。 |
案例展示
下面讲一个金融行业数据治理案例,金融数据治理通常包括体系建设、数据质量、安全防护、合规管理等方面,还有面临的挑战和未来方向。
金融数据治理的现状与核心挑战
-
数据质量问题普遍存在
金融机构在业务扩张过程中,普遍面临数据缺失、重复、错误等问题。例如,某综合性金融集团在业务系统数据清洗时发现,超过20%的客户信息存在字段缺失或格式错误。这直接导致风险模型准确性下降30%以上,影响信贷决策和监管报送的合规性。 -
数据安全风险升级
金融数据涉及客户隐私(如身份证号、交易记录)和商业机密(如定价模型)。2024年某证券公司的安全审计显示,其敏感数据在传输环节未加密的比例高达15%,存在被中间人攻击的风险。此外,多机构数据交换场景下(如跨境支付、联合风控),数据泄露风险呈指数级增长。 -
数据孤岛阻碍业务协同
证券行业典型案例显示,一家中型券商内部存在12个独立业务系统,客户数据在财富管理、两融、资管等板块重复存储且标准不一,导致跨部门业务协同效率降低40%。这种现象在银行、保险领域同样突出。 -
监管合规压力加剧
《证券期货业数据模型》等标准强制要求金融机构实现数据全生命周期可追溯。2024年某银行因未按ISO/IEC 38505-2标准完成数据分类,被处以2.3亿元罚款
金融数据治理的核心框架与实践路径
-
治理体系构建方法论
- 组织架构设计:设立三级治理体系(决策层:数据治理委员会;执行层:数据管理办公室;操作层:业务部门数据专员)
- 标准体系搭建:参考SDOM(证券期货业数据模型),制定包括数据元标准(如字段长度、编码规则)、质量规则(如完整性阈值≥99%)和安全分级(如客户身份证号需A级加密)
- 技术工具选型:采用网易EasyDesign等工具实现模型可视化设计,支持自动校验200+种数据质量规则
-
关键技术实施要点
- 数据模型规范
- 质量监控体系
-
建立三层监控机制:
- 实时校验层:在数据入库时拦截格式错误(如手机号非11位)
- 批量检查层:每日跑批检测业务逻辑矛盾(如理财产品收益率超过监管上限)
- 人工复核层:对高风险数据(如反洗钱黑名单)进行双人复核1
-
安全防护方案
实施"四重防护":- 传输加密:TLS 1.3协议全覆盖
- 存储加密:采用国密SM4算法
- 访问控制:基于RBAC模型设置200+个细粒度权限标签
- 审计溯源:区块链存证关键操作日志