数据中台
文章平均质量分 93
JavaEdge聊AI
关注并私信我,获取更多大厂求职经验。
《编程严选网》创始人,多年大厂一线开发经验,现魔都一线数据中心软件架构师。全网近30w粉丝,擅长分布式系统设计和AIGC应用开发。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据中台实战(11)-数据中台的数据安全解决方案
数据备份要兼顾备份性能、成本,推荐EC存储作为备份集群的存储策略数据权限要实现精细化管理,基于OpenLDAP+Kerberos+Ranger可实现一体化用户、认证、权限管理开发、生产环境物理隔离,两种部署模式,权衡效率、安全进行选择参考HDFS EC 存储介绍。原创 2023-10-07 22:25:10 · 1004 阅读 · 0 评论 -
数据中台实战(06)-数据模型无法复用,归根结底还是设计问题
本文详细讲解数据中台的模型设计。从确立设计目标,到通过一系列步骤,将一个个分散杂乱、烟囱式小数仓逐步规整到一个可复用共享的数据中台,最后通过产品化实现系统化的管理。完善度、复用度和规范度构成衡量数据中台模型设计的度量体系,可助你评估数仓设计好坏维度设计是维度建模的灵魂,也是数据中台模型设计的基础,维度设计的核心是构建一致性维度事实表的统计粒度须保持一致,不同统计粒度的数据不能出现在同一事实表数据中台构建需半年一年,但数据中台建成后,研发效率提升明显。原创 2023-10-06 19:38:58 · 438 阅读 · 0 评论 -
数据中台实战(05)-如何统一管理纷繁杂乱的数据指标?
不同部门对相同的“新用户销售额”,因为口径定义差别,导致指标数值的不一致。这是指标管理最易出现的case。口径不一致,数据就无法横向对比,失去数据辅助商业决策的意义。如何高效、规范化管理指标。如何构建全局一致的指标字典,通过系统+规范的方法,解决数据中台指标一致性管理的难题。数据中台直接产出的核心指标必须实施强管理,由数据中台团队的专人或者小组负责,最好是数据产品经理的角色。指标的管理必须结合系统+规范的治理方法,明确每个角色的职责,通过系统化的方法实现。原创 2023-10-06 19:35:55 · 1680 阅读 · 0 评论 -
数据中台实战(00)-大数据的尽头是数据中台吗?
数据中台构建于数据湖之上,具备数据湖异构数据统一计算、存储的能力,同时让数据湖中杂乱的数据通过规范化的方式管理起来。数据中台需要依赖大数据平台,大数据平台完成了数据研发的全流程覆盖,数据中台增加了数据治理和数据服务化的内容。数据中台借鉴了传统数据仓库面向主题域的数据组织模式,基于维度建模的理论,构建统一的数据公共层。吸收传统数仓、数据湖、大数据平台优势又解决数据共享的难题,通过数据应用,实现数据价值落地。原创 2023-09-27 11:14:56 · 1634 阅读 · 1 评论 -
建设数据中台到底有啥用?
建设数据中台到底啥用,一个数据中台收益框架包括两大维度、九个细分项。最核心的就是给我们建设数据中台这件事找到目标,可把这9项作为指导,先明确价值和方向,再找到应用场景,以此作为牵引来建设自己的数据中台。大部分企业要经历一个转型的,朝着数智化方向演进。企业的转型,从最早的信息化走向数字化,下一个目标是数智化。信息化解决的是企业内部的管理问题,让企业能够以一个有组织、有流程的方式高效地运转起来。数字化解决的是企业与外部的连接问题,让企业能够直接触达客户,并且建立线上的业务。原创 2023-07-29 17:40:00 · 1386 阅读 · 0 评论 -
探寻数据服务的本质:API之外的可能性
接口规范化定义就是取快递时我们约定的取件码。数据服务对各数据应用屏蔽不同的中间存储,提供统一API。数据服务界面示意图:上图可在数据服务上,定义每个API接口的输入和输出参数。数据服务化不是一个API接口这么简单,背后是数据标准化交付的整套流程。本文学到了数据服务的八大关键功能设计和三大系统架构设计。数据服务实现了数据中台模型和数据应用的全链路打通,解决了任务异常影响分析和数据下线不知道影响哪些应用的难题基于相同主键的物理模型,可以构建逻辑模型,逻辑模型解决数据复用难题,提高接口模型的发布效率。原创 2023-07-28 10:05:30 · 329 阅读 · 0 评论 -
数据中台实战(09)-数据服务:保障数据安全、提升数据价值的利器
数据接入和运维过程中,遇到的典型问题,简要分析数据服务为什么能够帮我们解决这些问题。而这些问题会让数据应用使用中台数据效率低下,同时也带来中台数据维护的烦恼。下讲聊数据服务具备哪些功能,你正准备设计一个数据服务或正做数据服务的产品选型,一定要留意。最后会提供给你一个数据服务实现方案,告诉你数据服务实现的关键设计。原创 2023-07-27 22:19:22 · 565 阅读 · 0 评论 -
数据中台实战(04)-打造高效数据中台,元数据中心是关键!
元数据包括数据字典、数据血缘和数据特征然后通过分析两个业界比较有影响力的元数据中心产品结合国内的数据中台实践,给出元数据中心设计的关键特性和技术实现架构最后介绍基于元数据中心之上的数据地图产品元数据中心设计须注意扩展性,能支持多数据源,宜采用集成型设计数据血缘需支持字段级血缘,否则影响溯源范围和准确性数据地图提供一站式数据发现服务,解决检索数据,理解数据的“找数据的需求”原创 2023-07-18 23:39:08 · 1190 阅读 · 0 评论 -
数据中台实战(03)-构建数据中台的三要素:方法论、组织和技术
数据中台建设的三板斧:方法论、支撑技术和组织架构。适合数据中台的组织架构是建设数据中台的第一步,数据中台组织一定是独立的部门,同时要避免与业务脱节,深入业务,要与业务目标绑定。数据中台支撑技术大规模落地,需要有成熟的系统工具作为支撑,同时要注意这些系统工具之间的联动和打通。原创 2023-07-18 10:19:58 · 737 阅读 · 0 评论 -
数据中台实战(02)-什么企业适合建设数据中台?
2018年线上流量枯竭,业绩增长乏力,企业成本高筑, 利润飞速下滑。原先粗放的企业管理模式和经营模式(如采购商品时,凭经验做出采购哪个商品的决策)已没法继续支撑企业高速增长,越来越多企业开始数字化转型,强调数据是企业增长新动力,它应深入企业经营各环。数据需求爆发式增长,促进数据产品发展,在每个业务过程中,都有大量数据产品辅助运营完成日常工作。如电商中,用户运营、商品运营、市场运营……每天有大量运营基于这些产品完成经营决策。原创 2023-07-17 23:08:33 · 541 阅读 · 1 评论
分享