
Flink
文章平均质量分 72
floret*
这个作者很懒,什么都没留下…
展开
-
Flink四大基石之Window
在流处理应用中,数据是连续不断的,有时我们需要做一些聚合类的处理,例如:在过去的1分钟内有多少用户点击了我们的网页。在这种情况下,我们必须定义一个窗口(window),用来收集最近1分钟内的数据,并对这个窗口内的数据进行计算。原创 2024-11-25 20:16:52 · 505 阅读 · 0 评论 -
Flink中的物理分区
关于分区,很多技术都有分区:1、hadoop 有分区2、kafka 有分区3、spark 有分区4、hive 有分区使用用户定义的Partitioner 为每个元素选择目标任务/*** @基本功能:**/@Overridereturn 0;return 1;public class _11_自定义分区规则 {//1. env-准备环境@Override});// 每一个分区的数据量有多少@Override。原创 2024-11-25 20:00:34 · 407 阅读 · 0 评论 -
Flink中普通API的使用
使用env.fromElements:类型要一致使用env.fromcollections:支持多种collection的具体类型使用env.generateSequence()方法创建基于Sequence的DataStream --已经废弃了使用env.fromSequence()方法创建基于开始和结束的DataStream// 各种获取数据的Source// 演示一个错误的Tuple2.of("张三", 18),原创 2024-11-25 19:50:07 · 1586 阅读 · 0 评论