【Flink基础】-- 延迟数据的处理

原创已于 2023-12-06 16:39:58 修改 · 1.3k 阅读

·

17

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#flink #网络 #智能路由器

于 2023-12-05 11:07:04 首次发布

Apache Flink 同时被 2 个专栏收录

53 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

35 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了互联网延迟的概念、原因及减少延迟的方法，并重点介绍了Flink如何处理延迟数据，包括设置Kafka topic分区、业务有序策略以及利用数据湖表格格式如Apache Hudi来解决乱序数据。

目录

一、关于延迟的一些概念

1、什么是延迟？

2、什么导致互联网延迟？

3、如何减少延迟？

二、解决数据延迟

1、用户如何解决延迟问题

2、flink 处理延迟数据

2.1 通过设置 kafka topic 的 partition =1 来处理延迟的乱序数据

2.2 通过业务有序，处理延迟的乱序数据

2.3 利用数据湖表格格式处理（如 apche hudi、paimon）

一、关于延迟的一些概念

1、什么是延迟？

延迟是数据从网络上的一个点传递到另一个点所需的时间。假设北京的服务器 A 向成都的服务器 B 发送一个数据包。服务器 A 在格林威治标准时间 10:20:00.000 发送数据包，服务器 B 在格林威治标准时间 10:20:00.125 接收数据包。此路径上的延迟量是这两个时间之间的差值：0.125 秒或 125 毫秒。

大多数情况下，延迟是在用户设备（“客户端”设备）和数据中心之间测量的。该测量值可帮助开发人员了解网页或应用程序为用户加载的速度。

尽管 Internet 上的数据以光速传播，但由于 Internet 基础设施设备造成的距离和延迟的影响，延迟永远无法完全消除。但延迟可以并且应该最小化。大量的延迟会导致网站性能下降，对 SEO 【“Search Engine Optimization”（搜索引擎优化）】产生负面影响，并可能导致用户完全离开网站或应用程序。

了解本专栏

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

oo寻梦in记 你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。