作者介绍
@云娜
某大厂数据开发平台的产品;
专注数据治理和数据平台的相关内容;
“数据人创作者联盟”成员。
全文一共2800字+,阅读需要10分钟
今天分享的主题是网易数据治理工具产品实践,主要分 4 部分:
第一部分是网易内部一些业务线过往数据治理专项活动的回顾;
第二部分是当前数据治理面临的痛点;
第三部分是针对当前的治理痛点进行产品整体策略的分享;
第四部分是数据治理工具未来的规划。
1 过往数据治理回顾
首先分享的是网易内部,例如严选、传媒、音乐等在数据治理方面面临的一些问题,然后是针对这些问题做出的产品策略以及初步取得的成效。对于业务线专项治理背景,都比较相似,一方面是随着业务的发展,严选、传媒和音乐的计算、存储达到瓶颈,但是对于业务方而言很难判断难以判断目前需要继续扩容增加资源,还是对劣质数据进行治理以降低资源危机,但是在这个过程中会面临如何定义劣质资源,怎么处理劣质资源,然后解决危机,因此进行治理成为亟待解决的问题。另一方面而言,数据的生产链路较长,缺乏数据加工的统一标准,整个团队内有哪些数据,这些数据应该由谁负责,团队内有哪些数据,这些数据通过哪些任务产出,数据是否被业务系统和下游系统有效使用,数据的存在是否有意义,这些问题数据团队都难以准确回答。