Spark(1)——Spark的安装

本文介绍了Apache Spark的基本概念,包括其支持的开发语言、主要组件及应用领域,并详细讲述了如何在CentOS 6.5环境下搭建Spark测试开发环境,涵盖环境准备、配置文件编辑、启动过程及Spark UI的访问。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.Spark简介

支持多种开发语言:Scala,Java,Python, R

涉及的领域

Spark Core数据的离线分析      ->  MapReduce

Spark Streaming数据在在线分析   ->  (实时处理) Strom

SparkSQL                 ->   功能上与Hive类似,性能上比Hive高

……

二.搭建Spark测试开发环境

2.1.环境准备

系统: centos 6.5

上传解压;tar -xvf spark-1.5.0-bin-hadoop2.6.tgz

2.2.编辑配置文件

vi conf/spark-env.sh.template

加入SPARK_LOCAL_IP= 本机的ip地址

复制刚才的文件:

cp conf/spark-env.sh.template conf/spark-env.sh

2.3.启动

./bin/spark-shell --master=local 

启动说明

Spark-shell (相当于driver),可以将代码发送集群运行,也可以在单机下运行进入到spark的安装目录

./bin/spark-shell --master=local  连接到本地服务,并使用单线程

./bin/spark-shell --master=local[n] 连接到本地服务,并使用n个单线程

./bin/spark-shell --master=local[*]连接到本地服务,*表示尽可能多得使用本地线程

./bin/spark-shell --master=集群地址  连接到spark集群当中spark://master的地址:7077

2.4.spark UI访问

ip:4040

如果在虚拟机之外访问不到,请关闭防火墙。

在排除此间错误时应确保虚拟机和宿主机能ping通。

2.5.退出:

 用:qCtrl+c退出spark-shell

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值