ETL is dead, long live streams

过去十年,数据和数据系统经历了重大变化,从单服务器数据库转向分布式数据平台,非事务性数据增加,流数据处理需求上升。传统ETL方法面临挑战,而流处理平台因其处理高容量、高多样性数据及提供实时数据的能力,正逐渐成为主流。

Reorganized according to Infoq talk "ETL is dead, long live streams"

 // 根据 Infoq 的演讲 《ETL 结束了、流处理万岁》重新整理

 

 

 

Data and data system changed a lot over the past decade. 

 // 过去的十年里,数据和数据库发生了重大的变化。

In the past, database and datawarehouse are main location for our data.

 // 在过去,数据库和数据仓库是我们数据的重要位置。

And most of the database and datawarehouse are relational. 

 // 大部分数据库和数据仓库都是关系型的数据库。

 

The recent data trend includes:

 // 未来的趋势如下

 

1. single server databases are replaced by a myriad of distributed data platform that operated at a company-wide scale. 

// 单服务器数据库已被在公司范围内运行的无数分布式数据平台所取代。

A medium to large size company could have more than one data centre in different locations.

// 一个大中型公司可能在不同的地点有多个数据中心。

 

2. There are many more non-transactional data: logs,images,sensors etc. 

// 还有很多非事务性的数据:日志、图像、传感器等

No-sql database appeared and data blending work more handly.

// NoSQL 数据库出现了,这些数据混合的工作更加地顺手

 

3. Stream data is increasingly ubiquitous,and faster processing is needed.

// 数据的流式处理变得更普遍,也需要更快的处理

 

Therefore, the tranditional way of Extract, Transform and Load becomes a giant mess, the shortcomings are as below:

 // 因此,传统的提取、转换和加载方式变得一团糟,缺点如下:

 

1. it needs a global schema

// 它需要一个全局的约束

 

2. data cleaning and curation is manual and fundamentally error-prone

// 数据清理和管理是手动的,而且基本上容易出错

 

3. operational cost of ETL is high and resource intensive.

// ETL的运行成本高、资源密集

 

4. ETL tools were normally built to narrowly focus on connecting to databases and datawarehouse in a batch fashion.

// ETL工具的构建通常只关注以批处理方式连接到数据库和数据仓库

 

Comparably, Streaming platform will have its shiny points:

// 相比之下,流媒体平台将有其闪光点

 

1. It is able to process high volume and high diversity data

// 它能够处理大容量、高分集的数据

 

2. It is able to provide real-time processed data from ground level

// 能够提供地面实时处理数据

 

3. It enables forward-compatible data architecture.

// 它支持向前兼容的数据体系结构

当前,全球经济格局深刻调整,数字化浪潮席卷各行各业,智能物流作为现代物流发展的必然趋势和关键支撑,正迎来前所未有的发展机遇。以人工智能、物联网、大数据、云计算、区块链等前沿信息技术的快速迭代与深度融合为驱动,智能物流不再是传统物流的简单技术叠加,而是正在经历一场从自动化向智能化、从被动响应向主动预测、从信息孤岛向全面互联的深刻变革。展望2025年,智能物流系统将不再局限于提升效率、降低成本的基本目标,而是要构建一个感知更全面、决策更精准、执行更高效、协同更顺畅的智慧运行体系。这要求我们必须超越传统思维定式,以系统化、前瞻性的视角,全面规划和实施智能物流系统的建设。本实施方案正是基于对行业发展趋势的深刻洞察和对未来需求的精准把握而制定。我们的核心目标在于:通过构建一个集成了先进感知技术、大数据分析引擎、智能决策算法和高效协同平台的综合智能物流系统,实现物流全链路的可视化、透明化和智能化管理。这不仅是技术层面的革新,更是管理模式和服务能力的全面提升。本方案旨在明确系统建设的战略方向、关键任务、技术路径和实施步骤,确保通过系统化部署,有效应对日益复杂的供应链环境,提升整体物流韧性,优化资源配置效率,降低运营成本,并最终为客户创造更卓越的价值体验。我们致力于通过本方案的实施,引领智能物流迈向更高水平,为构建现代化经济体系、推动高质量发展提供强有力的物流保障。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值