
🏡 个人主页:IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-优快云博客
🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。
🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频
目录
数据源分为有界和无界之分,有界数据源可以编写批处理程序,无界数据源可以编写流式程序。DataSet API用于批处理,DataStream API用于流式处理。
批处理使用ExecutionEnvironment和DataSet,流式处理使用StreamingExecutionEnvironment和DataStream。DataSet和DataStream是Flink中表示数据的特殊类,DataSet处理的数据是有界的,DataStream处理的数据是无界的,这两个类都是不可变的,一旦创建出来就无法添加或者删除数据元。
1. Flink 批数据处理案例
- Java 版本WordCount
使用Flink Java Dataset api实现WordCount具体代码如下:
ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment

本文详细介绍了Apache Flink的批处理和流式处理案例,包括Java和Scala版本的WordCount实现。批处理使用ExecutionEnvironment和DataSet,流处理使用StreamingExecutionEnvironment和DataStream。文中还总结了Flink程序编写流程、上下文环境创建、批流处理的区别以及对DataSet API被软弃用的说明。
订阅专栏 解锁全文
1054

被折叠的 条评论
为什么被折叠?



