字节跳动一站式数据治理思考及实践

本文介绍了字节跳动在数据治理方面的挑战与机遇,提出分布式数据自治思路,并详细阐述了一站式治理平台的技术架构,包括规划式与响应式治理流程。

动手点关注

2645c88910af6380148d66e4a5e4af51.gif

干货不迷路

导读:今天的分享主要分四个部分:机遇与挑战、数据治理思路、技术架构演进以及未来展望

1. 机遇与挑战

0633ef0ced445c64a09fa5a837bba051.png

数据治理工作有很多挑战,最主要的一点是落地比较困难。

首先,治理工作中与业务有一定的矛盾。

第二,治理涉及的组织和管理难度大。

第三,规范“人”的动作难度大,治理过程中,需要依靠人来推进和执行,人员能力参差不起,组织文化、目标也存在不对齐的情况。

第四,缺乏适配性强的产品工具。因为治理工作范围广,链路长,并且涉及跨部门、跨系统的目标对齐,需要一个完备的产品平台。

e3bfa7fba2d28bc00efd7aae90768564.png

下面结合字节的特点,介绍数据治理工作的机遇和挑战。

  • 字节文化

首先,字节业务多,多业务齐头并进发展,需要快速响应业务需求;

第二,字节的 OKR 文化,使得每个人都可以参与数据治理的规划和策略的制定,并且主动寻找实现路径,快速对齐;

第三,为追求高效治理,没有设立统一的数据治理委员会,而是各个部门根据各自的业务情况进行治理。

  • 业务第一

字节业务规模大,并且以数据作为驱动构建闭环的产品较多,导致数据质量对业务的影响非常大。

综上所述,数据治理在字节是挑战机遇与并存的工作。

2. 数据治理思路

2.1  新型数据治理 - 分布式数据自洽

d7fe2f9107bdb9e05f446ec5181e6f62.png

针对上述问题,提出了分布式数据自治的思路, 综合考虑治理收益、业务影响,执行效率。

首先,业务影响方面,为保证影响小,治理工作按照业务单元进行。一个业务单元可能是一个小团队或者小项目,作为数据治理的范围和目标。

第二,需要沉淀各业务线的治理经验,提升治理效率;通过产品辅助业务自驱,实现规则化、策略化、自动化治理。通过工具等平台能力,降低治理门槛。并且支持灵活的治理方式,如管理者视角,自上而下规划性治理,和一线执行者视角,自下而上推动治理。

第三,需要适配性强,建设产品来覆盖治理全链路。

实现多种场景中,产品都有能力覆盖,多个模块可以独立使用,按需组合;并且提供完整的开发能力,支持业务根据自身特点和发展阶段,自行接入。

2.2  集中式 VS 分布式

952ac95f8c96e29a1e0dbab86e77dacf.png

分布式治理,与传统集中式治理相比,有很多优势。

  • 集中式治理,需要制定制度进行大范围组织,划分权责,定期抽查考核,建设周期长,适配能力弱,并且组织投入多。

  • 分布式自治,业务影响小;周期短,见效快;效率高,节省人力;便于算清对业务的收益,降低成本。

3

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值