spark 安装配置记录

本文介绍如何下载并安装Apache Spark 2.0.0版本,包括解压软件包、设置环境变量及验证安装是否成功的过程。文中还提到了启动pyspark时的警告信息及默认的日志级别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 下载spark-2.0.0-bin-hadoop2.4.tgz
  2. 解压
sudo tar -xzf spark-2.0.0-bin-hadoop2.4.tgz 
  1. 为方便以后操作,创建连接文件
sudo ln -s spark-2.0.0-bin-hadoop2.4 /home/q/www/spark
  1. 配置环境变量, vim /etc/profile
export SPARK_HOME=/home/q/www/spark
export PATH=$SPARK_HOME/bin:$PATH
  1. 使环境变量立即生效
source /etc/profile
  1. 执行pyspark
Python 2.6.6 (r266:84292, Feb 22 2013, 00:00:18) 
[GCC 4.4.7 20120313 (Red Hat 4.4.7-3)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
/home/q/www/spark/python/pyspark/sql/context.py:477: DeprecationWarning: HiveContext is deprecated in Spark 2.0.0. Please use SparkSession.builder.enableHiveSupport().getOrCreate() instead.
  DeprecationWarning)
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel).
16/11/22 11:57:29 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Welcome to
      ____              __
     / __/__  ___ _____/ /__
    _\ \/ _ \/ _ `/ __/  '_/
   /__ / .__/\_,_/_/ /_/\_\   version 2.0.0
      /_/

Using Python version 2.6.6 (r266:84292, Feb 22 2013 00:00:18)
SparkSession available as 'spark'.
>>> 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值