如果要评选大数据或者数字化转型领域中哪个词最让人费解、最讲不清楚,“数据治理(Data Governance)”绝对是候选之一。说实话,笔者到现在也没有完全整明白,因为数据治理包含的范围太广了,可以说是包罗万象,任何和数据相关的行为和动作,不管是技术手段还是业务规则,不管是组织架构还是规范制度,都可以归入数据治理的范畴。
数据治理最权威的定义应该来自于国际数据管理协会(DAMA):数据治理是对数据资产管理行使权力和控制的活动集合。在DAMA发布的《数据管理知识体系指南(DMBOK2.0)》中给出了数据治理车轮图如下:
从上图可以看出,数据治理位于车轮图的正中央,是数据架构、数据建模、数据存储、数据安全、数据质量、元数据管理、主数据管理等10大数据管理领域的总纲,为各项数据管理活动提供总体指导策略。
可以说,数据治理是企业战略、组织架构、数据标准、管理规范、数据文化、技术工具的一个综合体。关于数据治理的详细探讨超出了本文的范围,感兴趣的读者可以查阅相关文献。本文要探讨的是档案数据需不需要治理?应该如何治理?
国家档案局档案馆(室)业务指导司领导今年4月份在“中国电子文件管理论坛”上作了《从数字档案馆(室)到智慧档案的路径和构想》的报告,其中给出了档案数据治理的框架如下图红框所示:
上图将档案数据治理划分为数据采集存储、数据治理分析和数据处理汇聚三个业务域,而数据治理分析又包括数据标准、数据模型、数据质量、数据处理、数据安全和数据校验六