39、实时数据分析与可视化:Spark应用实践

实时数据分析与可视化:Spark应用实践

1. 集群管理基础

在大数据处理中,集群管理是非常重要的一环,常见的集群管理系统有YARN和Mesos。

1.1 YARN

YARN是Hadoop新一代的MapReduce执行引擎,具备众多特性:
- 功能多样 :可以运行MapReduce、Spark等多种类型的程序。
- 组件构成 :由资源管理器和多个节点管理器组成。
- 应用运行方式 :应用在容器中运行,并提供自己的应用主程序。
- 调度器支持 :支持FIFO、容量和公平三种不同的调度器。
- Spark运行模式 :Spark在YARN上可以以yarn - cluster和yarn - client模式运行。
- 内存管理 :YARN会杀死使用内存超过允许范围的容器,因此调整 spark.executor.memoryOverhead 很重要。
- 日志管理 :提供日志聚合功能,方便日志检查。
- 资源分配 :是第一个支持动态分配的集群管理器。
- 安全访问 :是Spark可以访问通过Kerberos保护的HDFS的唯一集群管理器。

1.2 Mesos

Mesos也能运行不同类型的应

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值