- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 PostgreSQL 12.2 手册
(1 row)这样做是 OK 的,因为子查询是一次独立的计算,它独立于外层的查询计算出自己的聚集。聚集同样也常用于和GROUP BY子句组合。比如,我们可以获取每个城市观测到的最低温度的最高值:city | max(2 rows)这样给我们每个城市一个输出。每个聚集结果都是在匹配该城市的表行上面计算的。我们可以用HAVING 过滤这些被分组的行:13SQL语言city | max(1 row)
2023-11-13 14:55:47
2474
原创 【CDH大数据环境搭建文档】
2.另一方面在特殊场景下方便运维童鞋进行降级处理,比如类似于淘宝双十一这类大促活动,某个核心业务预期会有很大的流量涌入,为了保证核心业务的平稳,在资源共享的情况下只能牺牲其他非核心业务,在和非核心业务方充分交流沟通的基础上限制这些业务的资源使用,在流量极限的时候甚至可以直接停掉这些非核心业务。特点:在(离)线写、在线读,需求内存、高IO介质。适用于运维人员,因为该平台安装好以后,维护工作相对来将就轻松许多,例如:使用apache版本的运维人员,对某一个组件进行调优,需要消耗半天的时间进行调整,效率极低;
2023-11-13 14:30:03
268
原创 Hive开窗函数总结
普通的聚合函数聚合的行集是组,开窗函数聚合的行集是窗口。因此,普通的聚合函数每组(Group by)只返回一个值,而开窗函数则可为窗口中的每行都返回一个值。studentid=115,count1为所有的行数9,count2为分区class1中的行数5,count3为分区class1中math值
2023-04-24 10:24:34
485
原创 Atlas-Hook执行流程
总体来说,Atlas Hive Hook 的执行流程包括监听 Hive 事件、将事件信息转换成 Atlas 实体对象、将实体对象发送到 Atlas 服务等多个模块,通过这些模块的协同工作,实现了对 Hive 元数据的采集和管理。换成对应的 Atlas 实体对象。Atlas Hook 的实体发送模块:Atlas Hook 实现了实体发送器,用于将生成的 Atlas 实体对象发送到 Atlas 服务。Atlas 服务的实体存储和管理模块:Atlas 服务实现了实体存储和管理模块,用于将接收到的实体对象存储到。
2023-04-20 14:42:05
407
1
原创 Atlas之HiveHook源码简介
介绍了Hive中的Hook种类HiveQL生命周期Atlas-HiveHook原理介绍Hive中的Hook种类及各种Hook在HiveQL生命周期中的体现,最后介绍Atlas中的HiveHook流程。
2023-04-20 14:31:15
653
2
原创 搭建好的现成的大数据环境虚拟机导入Vmware直接用
大数据环境搭建,虚拟机导入直接用,各种环境都已搭建好了,下载后按照操作文档配置后就可以直接使用,省去了搭建环境的时间成本,对新手学习十分高效。
2022-03-18 05:52:13
2801
金融机构代码编码规则odc免费下载
2023-03-19
CFDAB原食品药品监管信息化标准体系PDF版免费下载
2023-03-19
大数据集群虚拟机-环境搭建-导入vmware直接使用
2022-03-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人