大数据中台-什么是中台一文详解就够了

最新推荐文章于 2025-09-18 18:49:19 发布

转载最新推荐文章于 2025-09-18 18:49:19 发布 · 2.3k 阅读

6 ·

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/u010848845/article/details/119884759?spm=1001.2014.3001.5501

文章标签：

#大数据

flink 同时被 2 个专栏收录

2 篇文章

订阅专栏

大数据中台

1 篇文章

订阅专栏

怎么又提到数据中台了，现在不是都在拆中台了吗？

这是一个疑惑，我一直也疑惑，也没有认真想过，以前也是道中途说。没有想到面试的时候，面试官又问道这个问题了。

我一开始的理解是：数据中台整合了数据仓库、数据平台等，直到网上查阅了一些资料才知道，原来中台和平台、数仓是平行的，并没有什么直接的关系，看图：

640?wx_fmt=png

三者的关键区别有以下几方面：

数据中台是企业级的逻辑概念，体现企业 D2V（Data to Value）的能力，为业务提供服务的主要方式是数据 API；
数据仓库是一个相对具体的功能概念，是存储和管理一个或多个主题数据的集合，为业务提供服务的方式主要是分析报表；
数据平台是在大数据基础上出现的融合了结构化和非结构化数据的数据基础平台，为业务提供服务的方式主要是直接提供数据集；
数据中台距离业务更近，为业务提供速度更快的服务；
数据仓库是为了支持管理决策分析，而数据中台则是将数据服务化之后提供给业务系统，不仅限于分析型场景，也适用于交易型场景；
数据中台可以建立在数据仓库和数据平台之上，是加速企业从数据到业务价值的过程的中间层。

从参考的文章里面提炼一些概念：

一、数据中台解决的问题

效率问题：为什么应用开发增加一个报表，就要十几天时间？为什么不能实时获得用户推荐清单？当业务人员对数据产生一点疑问的时候，需要花费很长的时间，结果发现是数据源的数据变了，最终影响上线时间。
协作问题：当业务应用开发的时候，虽然和别的项目需求大致差不多，但因为是别的项目组维护的，所以数据还是要自己再开发一遍。
能力问题：数据的处理和维护是一个相对独立的技术，需要相当专业的人来完成，但是很多时候，我们有一大把的应用开发人员，而数据开发人员很少。

数据中台是聚合和治理跨域数据，将数据抽象封装成服务，提供给前台以业务价值的逻辑概念

640?wx_fmt=png

二、数据中台应该具备什么能力？

中台最核心的一个关键组件是数据资产目录：企业的数据结构和数据资产目录是对整个企业开放的。所有人都能够通过这个资产目录了解公司有哪些类别的数据、包含什么属性、源数据由谁管理，这样就可以快速搞清楚这些数据是不是自己需要的。但数据本身可以不开放，因为数据是有隐私信息和安全级别的。

什么又是数据资产目录？

所谓的数据资产目录就是把数据的模型去重、归一、梳理，变成一个树状结构，这个树状结构不直接对应数据库中的字段。以航空货运为例，其数据资产可能包括货机、客运机的辅舱，一架货机就是一个数据资产目录的节点，而货机的各种属性（如货机型号、空间大小、年份等）就是这个节点下面的数据模型。数据资产目录做的事情就是从业务层面出发制定数据标准，将企业业务相关的数据资产模型抽取出来，这跟后面用什么数据库去存储、用什么结构去存储、存成结构化还是非结构化都没有关系。它相当于把企业的业务从数据层面做了一个梳理，用数据的语言把企业的业务模型还原出来。数据资产目录做好之后，后面才是用什么技术手段、从哪里提取数据来映射到这个数据资产目录。

除了开放，数据资产目录还应该具有标签描述、可检索，这样才能最大程度地方便真正使用数据的人，以最快的速度找到他们需要的东西。

数据中台所需要具备的数据能力概括为以下六种

640?wx_fmt=png