- 博客(3)
- 收藏
- 关注
原创 Hive架构及相关函数
Hive在我们大数据框架中是一个比较重要的部分,它是基于hadoop的一个数据仓库工具,可以讲结构化的数据文件映射为一张数据库表,并提供类sql查询功能; 数据仓库:为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
2022-09-20 20:09:17
809
原创 Flink窗口与水位线不得不说的秘密
众所周知,Apache Flink是一个框架和分布式处理引擎,用于对无界和有界流进行有状态计算。在我们的这个Flink框架中,自Flink1.12.0正式发布流批一体统一运行之后,我们的实时计算框架真正步入了Flink的时代,flink实现了流批一体,那么在我们的flink计算中怎么实现我们的批处理,这时候就有了这个窗口的概念;在我们的flink框架中有四大基石:时间语义(time)、状态编程(State)、检查点(checkpoint)、窗口(Window);
2022-09-07 17:37:06
878
3
原创 Kaka与Zookeeper的爱恨情仇(——zookeeper过半选举机制)
kafka与zookeeper介绍(zookeeper过半选举机制)
2022-09-05 19:48:40
749
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人