spark代码运行

Spark代码运行的详细步骤

原创于 2025-05-13 09:05:39 发布 · 119 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#spark #大数据 #分布式

1.下载scala插件

二、使用Maven创建新项目

1.启动idea,选择新建项目。之后的设置如下：

2.将Scala添加到全局库中（注意：Scala的版本不宜太高，最好是2-12.否则后面会报下面这个错误

3.设置maven依赖项。修改pom.xml文件，添加如下：

4.下载依赖。添加完成之后，刷新Maven，它会帮助我们去下载依赖。

5.编写代码。修改文件夹的名字。（注意：是在重构里面有重命名）

6.新建Scala类。如果这里没有看到Scala类的选项，就去检查第2步。（如果没有出现scala类，请再次添加全局库。）

7.选择Object，输入WordCount

9.准备待统计的词频文件。在项目根目录下建立文件夹input，并穿件两个文本文件：word1.txt, word2.txt。文本内容随意

10.运行代码。点击运行代码。（红色无所谓，只要后面出现：进程已结束，退出代码为 0。这句就是对的。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

那晚的她

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用IDEA进行Spark开发（二）-第一个scala程序

genglintong的博客

12-01

1万+

上面一篇文章博主已经给大家演示好了如何去配置一个本机的scala开发环境，现在我们就一起去写我们的第一个spark开发的scala程序吧! 打开IDEA，选择创建一个新的工程文件。点击scala，创建一个scala工程输入我们程序名称——word_count,我们要写一个词频统计程序。 JDK选择1.7 scala选择我们下载安装好的scala环境目录，这里是2.10.5 点击完成，即可进

详解 Spark 各种运行环境的搭建

weixin_44480009的博客

05-29

2094

Mesos 是 Apache 下的开源分布式资源管理框架Kubernetes（k8s）是目前最为流行的容器管理工具Windows 模式：将解压缩到无中文无空格的路径中执行解压缩文件路径下bin目录中的文件，启动 Spark 本地环境编写 Scala 程序执行或在 DOS 命令行窗口中执行提交指令。

参与评论您还未登录，请先登录后发表或查看评论

Spark认识&环境搭建&运行第一个Spark程序

weixin_33827731的博客

03-15

821

摘要：Spark作为新一代大数据计算引擎，因为内存计算的特性，具有比hadoop更快的计算速度。这里总结下对Spark的认识、虚拟机Spark安装、Spark开发环境搭建及编写第一个scala程序、运行第一个Spark程序。 1.Spark是什么 Spark是一个快速且通用的集群计算平台 2.Spark的特点 1）Spark是快速的 Spark扩充了流行的Mapreduce计算模型...

子雨大数据之Spark入门教程---Spark的安装和使用sbt、maven打包代码 2.1

飘过的春风

02-23

5512

Spark可以独立安装使用，也可以和Hadoop一起安装使用。本教程中，我们采用和Hadoop一起安装使用，这样，就可以让Spark使用HDFS存取数据。需要说明的是，当安装好Spark以后，里面就自带了scala环境，不需要额外安装scala，因此，“Spark安装”这个部分的教程，假设读者的计算机上，没有安装Scala，也没有安装Java（当然了，如果已经安装Java和Scala，也没有关系，...

被关在idea小黑屏里写spark程序

最新发布

sxy_1030_的博客

04-29

581

准备待统计的词频文件。在项目根目录下建立文件夹input，并穿件两个文本文件：word1.txt, word2.txt。如果这里没有看到Scala类的选项，就去检查第2步。（如果没有出现scala类，请再次添加全局库。2.将Scala添加到全局库中（注意：Scala的版本不宜太高，最好是2-12.否则后面会报下面这个错误。（红色无所谓，只要后面出现：进程已结束，退出代码为 0。添加完成之后，刷新Maven，它会帮助我们去下载依赖。（注意：是在重构里面有重命名）启动idea,选择新建项目。

基于spark运行scala程序（sbt和命令行方法）

zhangyuming010的专栏

07-11

1万+

在前面搭建好scala和spark的开发环境之后，迫不及待地想基于spark运行一下scala程序，于是找到了spark官方网站的链接（http://spark.apache.org/docs/latest/quick-start.html），介绍如何运行scala程序。现将具体的操作步骤详细介绍如下。链接中给出了一个SimpleApp.scala的例程，我们发现sublime这个编辑器对sc

精选资源

Spark运行架构

02-25

lApplication：SparkApplication的概念和HadoopMapReduce中的类似，指的是用户编写的Spark应用程序，包含了一个Driver功能的代码和分布在集群中多个节点上运行的Executor代码；lDriver：Spark中的Driver即运行上述...

spark项目代码以及数据

07-29

四、Spark代码分析由于压缩包中包含的是"spark项目代码"，我们可以期待看到以下内容： - 配置文件：如`spark-defaults.conf`，设置Spark运行的默认参数。 - Scala/Java/Python/R源代码：实现Spark作业逻辑，包括...

test_spark:测试 Apache Spark 的代码

06-22

实现是使用 Apache Spark 完成的。学习架构基于论文“Learning Feature Representations with K-means”和“Emergence of object-selective features in unsupervised feature learning”。上述架构的单层具有...

精选资源

tpcds:在Spark上运行TPC-DS基准测试的脚本

03-31

本文主要围绕如何在Spark上运行TPC-DS基准测试进行详细介绍，重点讲解相关的Shell脚本和操作步骤。首先，理解TPC-DS测试套件： TPC-DS是一组复杂的SQL查询，设计用来模拟真实世界的商业智能应用。它包括99个不同的...

Spark脚本提交/运行/部署

Spark MLlib 机器学习

12-23

6783

1、Spark脚本提交/运行/部署 1.1 spark-shell（交互窗口模式）运行spark-shell需要指向申请资源的standalone spark集群信息，其参数为MASTER，还可以指定executor及driver的内存大小。 sudo spark-shell --executor-memory 5g --driver-memory1g --master spark

Spark-Scala语言实战（1）

qq_49513817的博客

03-13

2122

这篇文章，我会从Scala基础开始，带着大家一起实战，一起学习。和大家一起，了解，深入，掌握这门语言。希望在本篇文章中，大家有所收获。也欢迎朋友们到评论区下一起交流学习，共同进步。

spark运行python脚本_如何使用spark-submit运行Scala脚本（与Python脚本类似）？

weixin_39712016的博客

12-09

522

"""SimpleApp.py"""from pyspark import SparkContextlogFile = "tmp.txt" # Should be some file on your systemsc = SparkContext("local", "Simple App")logData = sc.textFile(logFile).cache()numAs = logData....

linux下spark scala运行问题记录

薇酱的博客

11-02

1948

问题1.使用maven编译scala文件可以编译成功，但是遇到Exception in thread "main" java.lang.NoSuchMethodError: org.apache.spark.rdd.RDD.coalesce(IZLscala/math/Ordering;)Lorg/apache/spark/rdd/RDD; 这个错误，看名字就可以看出这只是个spark上基础的函

安装spark + 用命令运行scala相关项目 + crontab定时执行

qq_25529689的博客

08-20

1725

一、准备工作： 1.需要的软件：java安装jre1.8 spark-2.2.0.tar.gz(已配置好） 2.运行工程需要的东西：maven工程打的jar包 --prodmge-mapreduce-0.0.1-SNAPSHOT.jar，运行工程需要的lib，bjtds.sql 二、安装spark和配置spark的变量：主要是参考的https://blog.youkuaiyun.com/weixin_46995451/article/details/108709068 安装时需要注意spark版本..

Spark 运行第一个Scala程序WordCount