此去经年应是良辰好景虚设-优快云博客

原创 Flink主流数据连接广播流数据的水位正常生成处理

当使用Flink的主流数据来连接广播流数据的时候会因为维度流数据不包含水位线导致connect后无法正常生成水位线进而导致无法触发窗口计算或定时器因为水位线的传递策略就是这样下游的水位线依靠上游所有流的水位的最小值。因此只要在维度流中指定水位线的生成策略即可保证connect后也能够正常生成考虑到水位线取最小值这个特性可以给广播流数据恒定一个无法达到的水位线此时连接后的水位线策略就完全取决于业务流数据的时间。

2025-10-09 23:05:17 346

原创 Doris数据导入的多种方式

导入概览https://doris.apache.org/zh-CN/docs/data-operate/import/load-manual。

2025-05-17 17:01:33 1049

原创 FlinkCDC

首先进行说明当需要对字段进行修改的时候只能使用Doris的模型实现。

2025-04-27 22:36:02 845

原创正则表达式入门

正则表达式入门

2025-03-19 13:31:31 1133

原创读完大数据之路的一些总结

看书么应该包含两个部分第一个部分把书读薄第二个部分把书读厚虽然我没查过说这句话的人当初时这么理解的反正我的理解是第一遍读的时候要总结出书中大致的框架结构以这本书为例当然只说建模部分所谓数仓建模就是事实表、维度表、聚集表的设计当然ODS ADS层就不说了个人感觉没有什么值得建模的地方大不过是ODS层存储数据的原始样貌 ADS层存储指标结果供给BI系统抽数用那么结合书中的一些描述读完之后我感觉脑中应该有这样一幅图就算没白读。确定好粒度以后，就要针对这个粒度确定需要采样的状态度量。

2025-03-14 22:01:20 1107

原创在Kettle中使用变量同步每日增量数据

第二步增加常量方便处理考虑到还有一些历史数据的删除策略。第一步获取系统信息(时间为例)第三步使用计算器计算需要的日期。测试用Kettle版本为7.1。

2025-01-23 09:22:21 1049

原创 Linux基础命令

以我的主机为例打开终端后可以看到[root@node1 ~]$ 其中root表示当前登录的用户 @node1表示当前的主机名 ~表示当前所在的目录 $表示当前的用户是一个普通用户 root用户显示的是#

2025-01-18 10:38:03 1189

原创记一次Flink本地任务问题解决

使用Flink本地任务消费Kafka数据报错 A JNI error has occurred, please check your installation and try againException in thread "main" java.lang.NoClassDefFoundError

2025-01-18 10:35:35 189

weixin_53724418的博客