oo寻梦in记
这个作者很懒,什么都没留下…
展开
-
【Flink部署】-- 部署 flink 1.19.1 standalone 集群
注意:从 flink 1.19开始,flink-config.yaml 已经变更为 config.yaml。2.5、启动本地 standalone 集群。2.4、配置 config.yaml。2.1、下载 flink 二进制包。2.3、验证 flink 版本。2.2、配置全局环境变量。原创 2025-01-07 10:23:04 · 527 阅读 · 0 评论 -
【Flink】-- 自 flink 1.18.x 版本开始,独立 flink-sql-connector-kafka
近期,因业务需要,准备升级 Flink 版本至 1.19.x 版本(为何升级该版本?参考奇数稳定版本约定。这就说明,flink-connector-kafka 的包,已经不再默认集成到 二进制发布包中了,需要用户自行添加依赖。也许这是为了方便维护 flink 项目而出的新招吧!原因在官方文档已经说明(原创 2024-11-19 17:33:06 · 401 阅读 · 0 评论 -
【Flink】-- flink新版本发布:v2.0-preview1
Apache Flink 社区已于2024-10-23发布了 Flink 2.0版本,这是自 Flink 1.0 发布以来的首个重大更新。Flink 2.0 将引入多项激动人心的功能和改进,包括存算分离状态管理、物化表、批作业自适应执行等,同时也包含了一些不兼容的变更。目前提供的预览版旨在让用户提前尝试新功能并收集反馈。Flink 2.0 preview 版,而不是 stable 版本,所以请不要应用于生产环境。原创 2024-11-13 16:30:15 · 1557 阅读 · 0 评论 -
【Flink on k8s】- 15 - 将 flink on yarn 迁移到 flink on k8s
维护 3 个 HDP 集群使用某云实时计算 Flink。原创 2023-12-12 19:08:05 · 828 阅读 · 0 评论 -
【Flink on k8s】- 14 - Flink kubernetes operator 使用经验分享
PS:由于我们提交的是 flink batch 作业,而不是 streaming 的作业,所以可以看到 job 是 finished 状态。PS:初次构建时,会比较慢!因为没有缓存,需要下载许多依赖包。原创 2023-12-14 16:18:10 · 676 阅读 · 0 评论 -
【Flink on k8s】- 13 - Flink kubernetes operator 版本升级
2、停止生产上正在运行的 flink job说明:由于在生产上,我们已经有作业正在运行,所以在升级 flink kubernetes operator 之前,需要停止正在运行的 flink job。如下举例删除 basic-example 作业:(1)删除 deployment 和 pod(1)查询是否正常下线3、升级 CRD3.1 切换项目空间到 ns-flink-operator 下3.2 执行升级命令,即可升级 CRD。原创 2023-09-13 18:23:45 · 668 阅读 · 2 评论 -
【Flink on k8s】- 12 - Flink kubernetes operator 的高级特性
注意:一般情况下,我们优先选择 savepoint!原创 2023-12-07 15:22:00 · 508 阅读 · 2 评论 -
【Flink on k8s】- 11 - 使用 Flink kubernetes operator 运行 Flink 作业
【代码】【Flink on k8s】- 11 - 使用 Flink kubernetes operator 运行 Flink 作业。原创 2023-12-06 16:51:07 · 435 阅读 · 0 评论 -
【Flink on k8s】- 10 - Flink kubernetes operator 常用的命令
示例:$ $ kubectl -n flink-job get pod basic-example-85568899d9-m8wgx -o yaml >> job-status.json。示例:$ kubectl -n flink-job get pod basic-example-85568899d9-m8wgx -w。示例:$ kubectl -n flink-job logs basic-example-85568899d9-m8wgx -f。(6)暂停和恢复应用程序。原创 2023-08-28 09:48:44 · 749 阅读 · 0 评论 -
【Flink on k8s】- 9 - 本地部署 Flink kubernetes operator
flink kubernetes operator 版本: 1.4.0helm 版本: 3.1.0flink kubernetes operator 支持的 Flink 版本:v1.13, v1.14, v1.15, v1.16。原创 2023-08-11 10:30:41 · 1004 阅读 · 0 评论 -
【Flink on k8s】- 8 - Flink kubernetes operator 的架构和设计
Operator Namespace:用户可自定义名称(如 ns-flink-operator)原创 2023-12-06 16:34:54 · 414 阅读 · 0 评论 -
【Flink on k8s】- 7 - 在本地运行第一个 flink wordcount job
【代码】【Flink on k8s】- 7 - 在本地运行第一个 flink wordcount job。原创 2023-12-06 14:15:55 · 560 阅读 · 0 评论 -
【Flink on k8s】- 6 - Flink 核心特性
PS:自 Flink 1.15 开始,只有 Application Mode 和 Session Mode ,不再支持 Per-Job Mode。原创 2023-12-06 14:00:33 · 542 阅读 · 0 评论 -
【Flink on k8s】- 5 - 简要介绍 Flink
以上 logo 来源:https://flink.apache.org/powered-by/本页图片来源:https://flink.apache.org/use-cases/本页图片来源:https://flink.apache.org/use-cases/本页图片来源:https://flink.apache.org/use-cases/模式识别或复杂事件处理。原创 2023-12-06 11:33:19 · 395 阅读 · 0 评论 -
【Flink on k8s】- 4 - 在 Kubernetes 上运行容器
【代码】【Flink on k8s】4 - 在 Kubernetes 上运行容器。原创 2023-12-06 11:00:02 · 544 阅读 · 0 评论 -
【Flink on k8s】- 3 - Kubernetes 中的关键概念
在生产环境中,为了保障集群的高可用,通常会部署多个 Master。原创 2023-12-06 10:37:09 · 747 阅读 · 0 评论 -
【Flink on k8s】- 2 - 简要介绍 Kubernetes
2019 年 3 月,Kubernetes 项目发布了 1.14 版本,引入了 Pod Topology Spread 和 Pod Overhead 等新特性。2017 年 12 月,Kubernetes 项目发布了 1.9 版本,引入了 StatefulSet 和 Workload API 等新特性。2016 年 3 月,Kubernetes 项目发布了 1.2 版本,引入了许多新特性,包括自动扩展、服务发现和负载均衡等功能。原创 2023-12-05 14:45:30 · 551 阅读 · 0 评论 -
【Flink on k8s】- 1 - Flink Kubernetes Operator 简介 2023
Flink Kubernetes Operator 可以与 Kubernetes 的其他功能和工具集成,可以帮助用户快速定位和解决问题。Flink Kubernetes Operator可以在Kubernetes上实现高可用性,以确保 Flink 集群的稳定性和可靠性。Flink Kubernetes Operator 可以快速地部署 Flink 集群,而无需手动配置和管理集群。Flink Kubernetes Operator可以将Flink集群与其他应用程序隔离,以避免资源争用和干扰。原创 2023-03-22 17:24:04 · 951 阅读 · 4 评论 -
【Flink on k8s】- 0 - Flink kubernetes operator 快速入门与实战
1、课程目录2、课程链接。原创 2023-11-30 14:24:08 · 579 阅读 · 0 评论 -
【Flink进阶】-- Apache Flink Kubernetes Operator 1.6.0发布公告
的一部分,Flink 1.18 引入了一个新的端点,允许用户通过 REST API 重新缩放运算符(作业顶点)。我们已将操作员使用的 Flink 客户端库升级到 1.17.1 版本,由于 flink-kubernetes 模块 shading 的改进,这大大简化了构建和打包工作。例如,用户可以为 Flink 1.18 设置不同的默认配置(默认启用自适应调度程序)。1.6.0 对回滚机制进行了多项核心改进,以充分利用强大的升级流程,并涵盖更广泛的故障情况。该版本,并通过 Flink。)时,就地扩展才可用。翻译 2023-08-21 10:40:08 · 188 阅读 · 0 评论 -
【Flink基础】-- 延迟数据的处理
延迟是数据从网络上的一个点传递到另一个点所需的时间。假设北京的服务器 A 向成都的服务器 B 发送一个数据包。服务器 A 在格林威治标准时间 10:20:00.000 发送数据包,服务器 B 在格林威治标准时间 10:20:00.125 接收数据包。此路径上的延迟量是这两个时间之间的差值:0.125 秒或 125 毫秒。大多数情况下,延迟是在用户设备(“客户端”设备)和数据中心之间测量的。该测量值可帮助开发人员了解网页或应用程序为用户加载的速度。原创 2023-12-05 11:07:04 · 1064 阅读 · 0 评论 -
【Flink进阶】-- 监控反压
这些指标每两秒更新一次,上报的值表示 subtask 在最近两秒被反压(或闲或忙)的平均时长。比如,一个以恒定 50% 负载工作的 subtask 和另一个每秒钟在满负载和闲置切换的 subtask 的。如果一个 task 没有可用的输出 buffers,那么这个 task 就被认定是在被反压。WebUI 集合了所有 subTasks 的反压和繁忙指标的最大值,并在 JobGraph 中将集合的值进行显示。空闲的 tasks 为蓝色,完全被反压的 tasks 为黑色,完全繁忙的 tasks 被标记为红色。翻译 2023-08-14 10:40:01 · 163 阅读 · 0 评论 -
【Flink 基础】-- kubernetes-operator-1.5.0 发布
进一步的扩大可能不会永远发生。翻译 2023-07-20 11:09:13 · 135 阅读 · 0 评论 -
【Flink基础】-- 高效学习 flink kubernetes operator 的一些建议
学习 Flink Kubernetes Operator 可以帮助你更好地在 Kubernetes 上运行 Flink 应用程序。希望这些建议能帮助你更好地学习 Flink Kubernetes Operator。原创 2023-03-30 11:33:25 · 435 阅读 · 0 评论 -
【大数据】-- Flink 1.16.0 发布
flink 1.16.0 发布说明翻译 2023-03-01 09:58:36 · 449 阅读 · 0 评论 -
【Flink基础】-- 源码中的注解
1.Flink自定义注解级别在升级 Flink版本至 1.15.3时,偶然遇到了一个异常,然后就准备详细了解下源码中的注解。设计注解的初衷:为了更好地进行代码和版本管理,Flink使用了Java的注解特性自定义了注解,对代码进行增强说明。注解的使用场景:提供信息给编译器:编译器可以利用注解来探测错误和警告信息编译阶段时的处理:软件工具可以利用注解信息来生成代码,HTML文档或其他相应处理运行时的处理:某些注解可以在程序运行时接受代码的提取。原创 2023-01-10 10:53:44 · 878 阅读 · 0 评论 -
【Flink基础】-- Flink Application Mode
但是,该模式下,如果集群中的一个作业行为不正常或导致 TaskManager 宕机,则在该 TaskManager 上运行的所有作业都将受到故障的影响。Application 模式为每个提交的作业创建一个集群,但作业的main()方法将在JobManager上执行,以节省提取job graph所需的CPU周期,也节省客户端下载依赖及将job graph及其依赖关系传送到群集所需的带宽。总之,在 Session 模式下,集群生命周期独立于集群上运行的任何作业,并且集群上运行的所有作业共享集群资源。原创 2022-10-18 14:45:41 · 1342 阅读 · 0 评论 -
【Flink基础】-- Flink CDC介绍
一、Flink CDC 是什么? 2020年 Flink cdc 首次在 Flink forward 大会上官宣,由Jark Wu & Qingsheng Ren 两位大佬介绍,原始 blog 点击链接。 Flink CDC connector 可以捕获在一个或多个表中发生的所有变更。该模式通常有一个前记录和一个后记录。Flink CDC connector 可以直接在Flink中以非约束模式(流)使用,而不需要使用类似 kafka 之类的中间件中转数据。...原创 2022-03-25 16:07:01 · 21777 阅读 · 2 评论 -
【Flink on k8s】- 0 - flink kubernetes operator 入门与实践
课程链接:https://edu.youkuaiyun.com/course/detail/38831原创 2023-11-02 18:05:43 · 714 阅读 · 0 评论 -
【Flink】-- flink forward2021 pdf 下载
Flink forward 2021 大会已结束,相关演讲的 pdf 下仔链接,请点击:Flink Forward 峰会 - Flink Forward Asia 2021原创 2022-01-19 11:44:31 · 1792 阅读 · 0 评论 -
【Flink】-- Flink Forward 2021 大会议题
Flink Forward 2021 即将在北京召开的,共举办2天,大会议程已经提前公布。 有主会场和分会场(行业实践、核心技术、平台建设、实时数仓、实时数据湖、流批一体、开源解决方案、生产实践、机器学习),涉及的内容很多,具体项目请见图片介绍。活动详细介绍请见:https://flink-forward.org.cn/...原创 2021-12-24 14:34:32 · 1574 阅读 · 0 评论 -
【Flink基础】-- Flink 1.13.2版本发布
Apache Flink 社区在 2021.08.05日发布了 Apache Flink 1.13 系列的第二个修复错误的版本。 此版本包括 127 个修复和小改进。以下的列表包括修正错误和改进。有关所有更改的完整列表,请参考:Error - ASF JIRA。下面来看看部分更新内容: [FLINK-21445] 修复了应用程序模式在构建 PackagedProgram 时不设置配置的问题 [FLINK-22443] 修复了无法在批处理模式下执行极长的 sql的问题 ...原创 2021-10-18 20:02:15 · 669 阅读 · 0 评论 -
【Flink进阶】-- 监控 checkpoint 指标
概览监控OverviewHistorySummaryConfigurationCheckpoint 详细信息概览Flink 的 Web 界面提供了选项卡/标签来监视作业的 checkpoint 信息。在作业终止后,这些统计信息仍然可用。有四个不同的选项卡可显示有关 checkpoint 的信息:Overview,History,Summary和Configuration。以下各节将依次介绍这些内容。监控Overview概览选项卡列出了以下统计信息。请...翻译 2021-06-22 12:55:03 · 2436 阅读 · 0 评论 -
【Flink基础】-- 写入 Kafka 的两种方式
方式一:用 Robin 的方式写入 Kafka1、实现 exactly-once 语义的 kafka sink,用 Robin 的方式写入 Kafka2、randomRobin: 创建 FlinkKafkaProducer 时,指定空的 customPartitioner,flink 会把 一个 sink subtask 的数据以 round-robin 方式写入 kafka 的各个分区...原创 2020-04-20 21:58:24 · 4252 阅读 · 1 评论 -
【Flink 基础】-- 如何设置 TaskManager、Solt和 Parallelism
一、概念理解solt:把 slot 看做 cpu 的核一个slot一可以并行跑很多作业并发度:一个算子有多少个运行实例关系: slot数 = 最大并发度、一个slot一可以同时运行不同算子的一个实例二、参数设置说明计算 TaskManager 数量: 50/4 = 13 , 13个TM一共可以提供13*4=52 个 slot。最大并发是50,只占了 50 slot,还剩下...原创 2020-02-19 10:29:26 · 4933 阅读 · 0 评论 -
[Flink 学习] -- 编译 CDH-6.3.0 版本的 Flink 1.9.0
前言 由于 Apache Flink 的开源二进制包未提供 HDP、MapR和 CDH 的下载,所以,如果要兼容基于这些厂商的库编译 Apache Flink。本文主要介绍使用 CDH 的库进行编译 Apache Flink 1.9.0,希望对读者有所帮助。内容 1、环境 Jdk 1.8、macOS10.14.6、Maven 3.6.2和Scala-2.11....原创 2019-10-17 18:16:37 · 4849 阅读 · 11 评论 -
[Flink课程]---- 2.2 DataSet API & DataStream API & Table & SQL API 的对比
说明 本文基于 Flink -1.6.0 版本进行整理和分析,如有不妥之处,敬请指正。内容一、Flink 的技术栈图片来源:https://ci.apache.org/projects/flink/flink-docs-release-1.6/internals/components.html注意Table API & SQL 统一了 DataStre...原创 2018-12-22 11:47:46 · 2574 阅读 · 0 评论 -
[Flink基础]-- 一致性的3个级别
Flink 是流处理器,那么同样会涉及到一致性的3个级别,他们分别如下1、at-most-once这其实是没有正确性保障的委婉说法,故障发生后,计数可能丢失。2、at-least-once这表示计数结果可能大于正确值,但是绝不会小于正确值,即计数程序发生故障后可能多算,但是绝不会少计算。3、exactly-once这是指系统保证在故障发生后得到的计数结果与正确值一致。...原创 2018-12-13 11:26:32 · 1306 阅读 · 0 评论 -
[Flink基础]-- 1.4 与其他实时计算框架对比
对比其他计算框架SparkStormFlinkStreaming ModelMicro-batchNativeNativeFault ToleranceRDD based checkpointingRecord ACKscheckpointLatencyMediumVery LowLowThroughoutHighLowHigh...原创 2018-12-07 23:30:09 · 1802 阅读 · 0 评论 -
[Flink课程]---- 1.2 Flink 和 Spark 的对比
感谢原文作者:http://blog.madhukaraphatak.com/introduction-to-flink-for-spark-developers-flink-vs-spark/面向Spark开发人员的Apache Flink简介:Flink vs Spark世界还需要另一个大数据处理系统吗?这是我第一次听说Apache Flink时出现的问题。在大数据领域,我们没有缺乏框...翻译 2018-11-13 22:43:32 · 4179 阅读 · 2 评论