在ubuntu上搭建spark （单机环境）

最新推荐文章于 2025-06-03 10:37:27 发布

转载最新推荐文章于 2025-06-03 10:37:27 发布 · 3.4k 阅读

本文详细介绍了如何在Ubuntu 16.04上部署Spark 2.3.1，并配置必要的Java和Scala环境。通过步骤化的指导，包括安装JDK、Scala及下载Spark等操作，帮助读者快速搭建Spark集群并进行基本测试。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在ubuntu上搭建spark，记录一下

环境：ubuntu 16.04

spark-2.3.1-bin-hadoop2.7.tgz

http://spark.apache.org/docs/latest/quick-start.html

使用已有的hadoop用户登录

1.安装JDK，配置Java环境；

2.安装Scala

注意Scala和Spark的版本对应关系

sudo apt install scala

添加如下内容到~/.bashrc中

export SCALA_HOME=/usr/share/scala-2.11
export PATH=$PATH:${SCALA_HOME}/bin

生效

source ~/.bashrc

3.下载spark

wget http://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.3.1/spark-2.3.1-bin-hadoop2.7.tgz

tar zxvf spark-2.3.1-bin-hadoop2.7.tgz

sudo mkdir /usr/local/spark

mv spark-2.3.1-bin-hadoop2.7/* /usr/local/spark

为hadoop用户赋予spark目录权限
sudo chown -hR hadoop /usr/local/spark

4.运行测试

使用自带的Python Shell测试：

cd /usr/local/spark/bin
./pyspark

lines = sc.textFile("/usr/local/spark/README.md")

lines.count() 字数统计

lines.first()

使用自带的Spark Shell测试：

./bin/spark-shell

查看当前节点运行情况

cd sbin
./start-all.sh
在浏览器中输入http://localhost:8080

参考：

http://www.powerxing.com/spark-quick-start-guide/

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ogre2020

关注关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Spark 单机和集群环境部署教程

qq_42568323的博客

08-07

2065

通过以上步骤，我们成功部署了 Spark 单机和集群环境，并实现了一个简单的 Word Count 应用。Spark 提供了强大的分布式计算能力，可以处理大规模数据，并支持多种编程语言。

Ubuntu 18.04下搭建单机Hadoop和Spark集群环境

qq_40907977的博客

09-29

624

Hadoop在整个大数据技术体系中占有至关重要的地位，是大数据技术的基础和敲门砖，对Hadoop基础知识的掌握程度会在一定程度决定在大数据技术的道路上能走多远。最近想要学习Spark，首先需要搭建Spark的环境，Spark的依赖环境比较多，需要Java JDK、Hadoop的支持。我们就分步骤依次介绍各个依赖的安装和配置。新安装了一个Linux Ubuntu 18.04系统，想在此系统上进行环境搭建，详细记录一下过程。 1、Java JDK8的安装前往Oracle官网下载JDK8，选择适合自己操作系统

1 条评论您还未登录，请先登录后发表或查看评论

Ubuntu系统：分布式spark环境搭建

ying.F的博客

01-17

1462

三台机子，系统为ubuntu14.01，公用一个路由器组成一个小型局域网。首先配置固定的ip地址。点击屏幕右上方的网络连接，Edit Connections -&amp;gt; Add -&amp;gt; 类型选Ethernet -&amp;gt; Create -&amp;gt; 选择IPv4 Setting -&amp;gt; Method选择 Manual（手动）-&amp;gt; Add 对于可

Spark 单机模式部署与启动

热门推荐

红色石头的专栏

05-07

1万+

说道大数据和机器学习，就少不了Spark.本文主要介绍在Linux下搭建单机环境的Spark的步骤。安装Java SE1、下载JAVA SE linux版本。下载地址为： http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html注意选择Linux版本，根据机器类型选择32位或者64位。2、

ubuntu 部署spark

pzy0668的专栏

05-19

3090

确保机器能够正常上网。首先下载spark安装包，

在Ubuntu环境部署Apache Spark集群

chszs的专栏

12-03

3925

在Ubuntu环境部署Apache Spark集群作者：chszs，未经博主允许不得转载。经许可的转载需注明作者和博客主页：http://blog.youkuaiyun.com/chszs1、软件环境本文主要讲述怎样在Ubuntu系统上部署Apache Spark独立集群（Standalone Cluster）的过程。所需的软件如下： Ubuntu 15.10 x64 Apache Spark 1.5.1 2、

在Ubuntu里搭建spark环境

weixin_33894640的博客

05-08

371

注意：1.搭建环境：Ubuntu64位，Linux（也有Windows的，我还没空试） 2.一般的配置jdk、Scala等的路径环境是在/etc/profile里配置的，我自己搭建的时候发现我自己在profile配置环境会有问题，比如说：我配置了spark，source了profile，启动spark是没问题的，但是当我想再次启动spark的时候，就会启动失败，需要...

Ubuntu下搭建spark2.4环境（单机版）

Tattoo

11-23

1025

说明：单机版的Spark的机器上只需要安装JDK即可，其他诸如Hadoop、Zookeeper（甚至是scala）之类的东西可以一概不安装。集群版搭建：Spark2.2集群部署和配置一、安装JDK1.8 1、下载JDK1.8，地址 2、将下载的文件保存在 /home/qq/java下，进行解压，解压后文件夹为 jdk1.8.0_171： tar -zxvf jdk-8u171-linux-i5...

Hadoop（伪分布式）+Spark（local模式）搭建Hadoop和Spark组合环境

m0_60154718的博客

03-15

4666

一、安装Hadoop 二、安装Spark

Ubuntu搭建单机和分布式spark

01-27

对于希望在Ubuntu上建立单节点Spark环境的情况，操作相对简单。首先需要下载并安装Java Development Kit(JDK)，因为Spark依赖于JVM来运行。之后可以从Apache官方网站获取最新的Spark版本，并解压到指定位置。为了...

Ubuntu的Spark 搭建实验（这次是完整的哈，没有错误）

qq_56437391的博客

03-31

5773

学习目标：学会Spark环境的搭建学习内容：学习Spark搭建环境的过程一. 软件的下载，解压与安装二. 环境的配置学习环境：环境组合是Spark2.3.3+Java8+Scala2.11（这里都不是最新版本的，需要的话自行去官网搜索就好，直接官网下载就可以）一、软件的下载，解压和移动 1.1 软件的下载，这里采用的wget命令代替 wget http://i9000.net:8888/sgn/HUP/spark/spark-2.3.3-bin-hadoop2.7.

【Ubuntu-大数据】spark安装配置

许多仙的博客

10-05

2980

然后按下退出键ESC，然后是shift+冒号健输入一个英文冒号，他就会在最下面生成一个冒号。（4）赋予该文件相关权限（lpp2是你的hadoop名字，可以在设置的【用户】中查看）（8）直接使用它bin下面的这个命令来运行试试：（运行它自带的实例，检查是否安装成功）（1）解压压缩包到之前Hadoop安装的目录：本地计算机-usr-local。这里采用3台机器（节点）作为实例来演示如何搭建Spark集群，细心的你会发现，其实就是加了一个hadoop的路径，按i进入插入模式，插入完成，

Ubuntu系统安装单机版Spark

malingyu的专栏

02-23

1775

步骤1：下载 http://spark.apache.org/downloads.html 解压tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz -C /usr/local步骤2：配置环境变量 sudo vim /etc/profile export SPARK_HOME=/usr/local/spark-2.4.5-bin-hadoop2.7 export PATH=$SPARK_HOME/bin:$PATH 刷新环境变量source /etc/...

ubuntu16.04 安装单机版spark

ustbbsy的博客

09-04

569

1 环境变量 spark-2.3.0-bin-hadoop2.7这是我的spark文件夹，这里替换成你的spark文件夹。同样，jdk1.8.0_172是我的jdk文件夹，你需要替换成你的。 usr/路径下没有java文件夹，你需要新建一个文件夹，mkdir /usr/java export SPARK_HOME=/usr/local/spark-2.3.0-bin-hadoop2.7...

Ubuntu下Spark单机版（Standalone）安装

星之所在

10-11

1647

一、安装JDK 二、安装Scala 三、安装Spark

ubuntu安装spark

weixin_43097621的博客

03-13

222

ubuntu安装spark安装jdk 安装jdk jdk下载 jdk下载链接解压安装包到指定位置 sudo tar -zxvf jdk-xxx.tar.gz(压缩包名) -C /usr/local 修改环境变量 sudo vim /etc/profile #安装目录 export JAVA_HOME=/usr/local/jdk(解压的java文件) #下面都一样啦 export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH e

Ubuntu 16.04搭建Spark源码研读和代码调试的开放环境

小兴安岭的博客

03-12

546

1. 准备必要的开发工具和环境：安装 jdk 1.8：参考链接：https://blog.youkuaiyun.com/smile_from_2015/article/details/80056297 scala 2.11.8 下载地址：https://www.scala-lang.org/download/2.11.8.html 我下载的文件名是scala-2.11.8.tgz ## s...

Ubuntu的SPARK安装与应用

YEExl的博客

04-17

1020

mac中Ubuntu安装spark，rdd编程