
大数据平台
文章平均质量分 50
留歌留歌
只要最后那个人是你,晚一点也没关系
展开
-
Control-M 调度工具
ControlM原创 2022-05-06 19:38:17 · 8392 阅读 · 1 评论 -
Flink1.13 cumulate window 累加窗口的使用
import org.apache.flink.api.common.eventtime.SerializableTimestampAssigner;import org.apache.flink.api.common.eventtime.WatermarkStrategy;import org.apache.flink.api.common.functions.MapFunction;import org.apache.flink.streaming.api.datastream.SingleOu.原创 2022-04-02 14:45:27 · 7475 阅读 · 0 评论 -
Flink CDC通过分流的方式将多个库表写入不同的Kafka Topic
import com.alibaba.fastjson.JSON;import com.alibaba.fastjson.JSONObject;import com.alibaba.ververica.cdc.connectors.mysql.MySQLSource;import com.alibaba.ververica.cdc.connectors.mysql.table.StartupOptions;import com.alibaba.ververica.cdc.debezium.Debez原创 2022-03-31 11:11:07 · 6456 阅读 · 0 评论 -
Flink生产最jia实践
内存使用最佳实践: 关键在于资源情况能不能抗住高峰时期每秒的数据量JM2~4G 足够单个 TM2~8G 足够numberOfTaskSlots 与容器核数相关 [1slot :1core 或 1slot :2core]CPU利用最佳实践:使 用 DominantResourceCalculator 策 略 并 指 定 容 器vcore 数bin/flink run -t yarn-per-job -d -p 5 -Drest.flamegraph.enabled=true -Dya原创 2022-02-22 15:21:47 · 920 阅读 · 0 评论 -
Flink 架构浅析 & 并行度 Slot 的关系
JobManager 和 TaskManager之间的通信都是借助于 Akka Framework,包括任务的状态以及Checkpoint 触发等信息Flink中每一个worker(TaskManager)都是一个JVM进程,它可能会在独立的线程(Solt)上执行一个或多个subtask一般一个Slot启动一个subtaskFlink的每个TaskManager为集群提供SoltSlot的数量由集群中flink-conf.yaml配置文件中设置taskmanager.numberOfTaskSlo原创 2022-02-22 14:01:25 · 2665 阅读 · 0 评论 -
DataX 浅入浅出
DataX定位:是一个异构数据源之间的离线同步工具架构:采用Framework + Plugin架构构建,将数据源读取和写入抽象成为Reader/Writer插件核心模块:DataX完成单个数据同步的作业,我们称之为Job,DataX接受到一个Job之后,将启动一个进程来完成整个作业同步过程。DataX Job模块是单个作业的中枢管理节点,承担了数据清理、子任务切分(将单一作业计算转化为多个子Task)、TaskGroup管理等功能。DataX Job启动后,会根据不同的源端切分策略,将Jo原创 2022-02-21 18:55:28 · 891 阅读 · 0 评论 -
快速上手完成一个自己的前端框架
写在前面作为一个后端程序员,很多时候我们也想自己搞一个炫酷的前端页面出来。无奈专精后端的我们 已经精疲力尽了,但是作为一个程序员。怎能没有一颗全栈的心呢!目前前端比较流行的框架Vue.js,在这基础上有一批成熟的后台系统开源项目。1、element (截止发稿前 start 51.8k)官网:http://element.eleme.io地址:https://github.com/Pa...原创 2020-04-03 18:22:03 · 1363 阅读 · 0 评论