
大数据技术
文章平均质量分 94
在这个专栏中,我们将深入探索大数据技术的广袤天地。从数据的采集、存储,到数据的处理、分析与可视化,全方位剖析大数据技术的核心要点。无论是 Hadoop 分布式系统的架构奥秘,还是 Flink 实时数据处理的精妙之处,亦或是各类大数据算法与模型的深度解读,都将一一呈现。
不正经小新
正在努力的小新~ | 超级爱分享,分享各种有趣干货 | 感谢关注,关注了你就是我的超级粉丝啦!
展开
-
揭秘Flink DataStream:深入socketTextStream源码分析与WordCount实战
揭秘Flink DataStream:深入socketTextStream源码分析与WordCount实战原创 2024-11-11 23:45:37 · 1104 阅读 · 0 评论 -
深入Flink StreamGraph:构建流处理拓扑的奥秘
表示流式处理拓扑的类,它包含构建执行任务图所需的所有信息。说白了就是我们写的代码直接生成的图,表示程序的拓扑结构StreamGraph类图,可以看到这个类里面包含了执行任务所需的所有信息,比如状态后端,JobType(流or批)、checkpoint配置等等,我们今天从宏观层面看,不深入每个细节,先看大体,再慢慢深入研究~🥹🥹🥹。原创 2024-11-11 23:44:48 · 4650 阅读 · 0 评论 -
Flink状态State | 大数据技术
在 Flink 中,状态是流处理程序中非常重要的一部分,它允许你保存和访问数据,以实现复杂的计算逻辑。可以简单理解为:历史计算结果原创 2024-06-03 19:09:23 · 1416 阅读 · 4 评论 -
Flink窗口理论到实践 | 大数据技术
⭐⭐个人主页🔎哆啦A梦撩代码🎉欢迎关注🔎👍⭐️留言📝原创 2024-05-06 22:33:03 · 11306 阅读 · 52 评论 -
Flink时间语义 | 大数据技术
Flink中,时间通常分为三类EventTime:事件(数据)时间,是事件/数据真真正正发生时/产生时的时间IngestionTime:摄入时间,是事件/数据到达流处理系统的时间ProcessingTime:处理时间,是事件/数据被处理/计算时的系统的时间Flink的三种时间语义中,处理时间和摄入时间都可以不用设置Watermark。如果我们要使用事件时间Event Time语义,以下两项配置缺一不可原创 2024-05-06 22:30:42 · 1412 阅读 · 5 评论 -
Flink设计&运行原理 | 大数据技术
为了支持分布式运行,Flink和其他大数据框架一样,采用了主从架构原创 2024-04-15 13:33:22 · 13187 阅读 · 24 评论 -
Flink入门学习 | 大数据技术
我们今天来编写一个Flink入门学习案例原创 2024-04-15 13:25:14 · 8401 阅读 · 0 评论