
流式处理
文章平均质量分 69
me凡
这个作者很懒,什么都没留下…
展开
-
Flink面试常见的25个问题(无答案)
flink和spark streaming的优缺比较 Flink on Yarn任务提交流程 Flink Sql的执行过程 Flink所使用的版本 Flink 内存模型 Flink Watermark机制 Flink CheckPoint机制?kafka exactly-once的两阶段提? Flink 状态存储backend类型?RocksDBStateBendback的使用场景,优缺点?Flink1.14版本状态存储类型的变化 ? FlinkSql 无界流聚合中mini-batch的使.原创 2022-03-30 14:43:30 · 2606 阅读 · 0 评论 -
flinksql 窗口提前触发
场景:一天的窗口,想每分钟或其他时间点触发一次insert into sliding_window_local_pay_dayselect userid, TUMBLE_START (ptime, INTERVAL '1' DAY) as window_start, TUMBLE_END (ptime, INTERVAL '1' DAY) as window_end, COUNT (1) as pay_numfrom flink_kafka_join_paygroup by TU原创 2021-09-22 17:26:46 · 1620 阅读 · 0 评论 -
Flink checkpoint源码理解
参考:https://blog.jrwang.me/2019/flink-source-code-checkpoint/#checkpoint-%E7%9A%84%E5%8F%91%E8%B5%B7%E6%B5%81%E7%A8%8Bhttps://cloud.tencent.com/developer/article/1593969https://blog.youkuaiyun.com/zc19921215/article/details/108171455Flink checkpoint主要包括 bar原创 2021-08-26 19:18:37 · 741 阅读 · 1 评论 -
Flink Interval Join源码理解
参考:https://www.jianshu.com/p/179beca9f307interval join :两条数据流+between边界+过期数据清理demo:下面看下源码实现intervalJoin 属于 KeyedStream,源码部分也在KeyedStream中KeyedStream的intervalJoin创建并返回IntervalJoin IntervalJoin提供了between操作,用于设置interval的lowerBound及upperBound...原创 2021-08-11 20:08:45 · 830 阅读 · 0 评论 -
Flink Kafka两阶段提交理解
1. 参考https://zhuanlan.zhihu.com/p/1113042812. Two-Phase Commit(2PC)分为 提交请求(投票)和提交(执行)两个阶段3.在Flink KafkaProducer中继承了TwoPhaseCommitSinkFunction来实现两阶段提交的功能(要弄清楚两阶段分别干了什么事) 该类下 有四个子类 protected abstract TXN beginTransaction() throws Exceptio...原创 2021-02-20 19:01:53 · 2139 阅读 · 1 评论 -
Flink1.11 intervalJoin watermark生成,状态清理机制源码理解&Demo分析
参考博客https://cloud.tencent.com/developer/article/1738836数据类型为左流FlinkClick(userid=gk01, click=Pay, ctime=2020-12-14 09:55:00.000) ; 右流为FlinkPay(userid=gk01, payway=alipy, ptime=2020-12-14 09:58:00.000)join的这段代码如下 clickOut.keyBy(t->t.getUs...原创 2020-12-14 20:41:22 · 2603 阅读 · 3 评论 -
flink1.11 sql本地运行demo & 本地webUI可视解决
1. pom依赖 <properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <flink.version>1.11.0</flink.version> <avro.version>1.8.2</avro.version> <java.version原创 2020-11-28 18:13:31 · 1956 阅读 · 2 评论 -
Flink Demo测试------Kafka连接(Flink1.8;Hadoop3.0)
pom文件 <name>Flink Quickstart Job</name> <url>http://www.myorganization.org</url> <repositories> <repository> <id>apache.snapsh...原创 2019-06-05 13:43:33 · 1805 阅读 · 0 评论 -
Flink Demo测试------读取本地文件WordCount并写入mysql(Flink1.8;Hadoop3.0)
pom文件<name>Flink Quickstart Job</name> <url>http://www.myorganization.org</url> <repositories> <repository> <id>apache.snapsho...原创 2019-06-05 13:48:14 · 3357 阅读 · 0 评论