一、平台搭建
1.1.Amabari+HDP
1.2.CM+CDH
二、相关的技术栈
数据存储:HDFS,HBase,Kudu等
数据计算:MapReduce,Spark,Flink
交互式查询:Impala,Presto
在线实时分析:ClickHouse,Kylin,Doris,Druid,Kudu等
资源调度:YARN,Mesos,Kubernetes
任务调度:Oozie,Azakaban,AirFlow,DolphinScheduler等
元数据管理:开源的Netflix的Metacat、Apache的Atlas,商业化的产品Cloudera Navigator
数据安全管理:Ranger
数据自助可视化:Davinci
本文详细介绍了Amabari+HDP和CM+CDH平台搭建,涵盖数据存储(HDFS、HBase等)、计算(MapReduce、Spark等)、交互查询(Impala、Presto)及实时分析工具。还探讨了资源调度(YARN、Kubernetes)、任务调度(Airflow)和元数据管理(Metacat、Atlas)等内容,以及数据安全(Ranger)和可视化(Davinci)实践。
2083

被折叠的 条评论
为什么被折叠?



