- 博客(5)
- 收藏
- 关注
原创 读完大数据之路的一些总结
看书么 应该包含两个部分 第一个部分把书读薄 第二个部分把书读厚 虽然我没查过说这句话的人当初时这么理解的 反正我的理解是第一遍读的时候要总结出书中大致的框架结构 以这本书为例 当然只说建模部分 所谓数仓建模就是事实表、维度表、聚集表的设计 当然ODS ADS层就不说了 个人感觉没有什么值得建模的地方 大不过是ODS层存储数据的原始样貌 ADS层存储指标结果 供给BI系统抽数用 那么结合书中的一些描述 读完之后我感觉脑中应该有这样一幅图就算没白读。确定好粒度以后,就要针对这个粒度确定需要采样的状态度量。
2025-03-14 22:01:20
980
原创 在Kettle中使用变量 同步每日增量数据
第二步 增加常量方便处理 考虑到还有一些历史数据的删除策略。第一步 获取系统信息(时间为例)第三步 使用计算器计算需要的日期。测试用Kettle版本为7.1。
2025-01-23 09:22:21
553
原创 Linux基础命令
以我的主机为例打开终端后可以看到[root@node1 ~]$ 其中root表示当前登录的用户 @node1表示当前的主机名 ~表示当前所在的目录 $表示当前的用户是一个普通用户 root用户显示的是#
2025-01-18 10:38:03
1101
原创 记一次Flink本地任务问题解决
使用Flink本地任务消费Kafka数据报错 A JNI error has occurred, please check your installation and try againException in thread "main" java.lang.NoClassDefFoundError
2025-01-18 10:35:35
141
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人