
大数据调度平台
Spark on yarn
这个作者很懒,什么都没留下…
展开
-
大数据调度平台之-Azkaban
一、Spark-Core(三)回顾 1.1、Spark on yarn的运行方式 二、Shuffle的剖析 2.1、2.1、IDEA下使用repartition和coalesce对用户进行分组 2.2、coalesce和repartition在生产上的使用 2.3、reduceByKey和groupByKey的区别 2.4、图解reduceByKey和groupByKey 2.5、reduceByKey和groupByKey的源码&&aggregateByKey 2.6、collect原创 2020-06-13 17:45:34 · 2264 阅读 · 0 评论 -
大数据调度平台之Rundeck生产实践
一、项目回顾 二、数仓的各项理论知识 2.1、什么是数据仓库 2.2、数仓分层-星型模型 2.3、数仓分层-雪花模型 2.4、数仓分层-星座模型 三、ERP项目架构 3.1、数仓分层流程图 一、项目回顾 ...原创 2020-04-14 11:11:44 · 1228 阅读 · 0 评论