bigdata
文章平均质量分 87
milo.qu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Flink快速上手使用
本文介绍了Flink开发环境的配置和基本编程步骤。主要内容包括:1)创建Maven项目并添加Flink依赖;2)Flink程序开发步骤:获取执行环境、加载数据、指定算子、设置输出和执行程序;3)实现实时流处理(SocketWindowWordCount)和批处理(BatchWordCount)两个案例;4)对比了流处理(StreamExecutionEnvironment/DataStream)和批处理(ExecutionEnvironment/DataSet)的主要区别。文章提供了Java和Scala两种原创 2025-09-14 16:55:29 · 578 阅读 · 0 评论 -
快速了解Flink
Apache Flink是一个开源的分布式流处理框架,具有高性能、高可用和精确处理的特点。它同时支持流处理和批处理,将批处理视为流处理的特殊情况。Flink的核心组件包括数据源、转换算子和数据输出,其执行引擎灵活支持不同数据传输模型,通过调整缓存块超时值实现低延迟或高吞吐。与Storm和Spark Streaming相比,Flink提供精确一次处理语义、基于检查点的容错机制和状态管理,适合需要高吞吐、低延迟和状态管理的场景。Flink还构建了包含实时计算、机器学习等功能的生态圈,支持多种部署模式。原创 2025-09-14 16:21:56 · 853 阅读 · 0 评论 -
Spark快速上手
解释:Streaming - Spark 流计算SQL - Spark SQL计算MLib - Spark 机器学习库GraphX - Spark 图计算。原创 2025-02-06 09:38:42 · 793 阅读 · 0 评论
分享