IDEA SPARK SCALA 搭建简单的helloworld

最新推荐文章于 2025-06-26 16:42:28 发布

邓闰土

最新推荐文章于 2025-06-26 16:42:28 发布

阅读量7.1k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：大数据

本文链接：https://blog.youkuaiyun.com/qq_21586623/article/details/71403428

大数据专栏收录该内容

11 篇文章

订阅专栏

本文详细介绍了如何在IntelliJ IDEA中搭建Scala+Spark的开发环境，包括创建Maven项目、配置Scala SDK、设置项目目录结构、添加Spark依赖等步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

新建maven工程：

在第一次使用idea时，如下图选择新建工程

Paste_Image.png

如下图，选择maven工程，sdk通过new，选择安装的jdk，然后点击next：

Paste_Image.png

填写groupid和artifactid

Paste_Image.png

项目名根据需要可修改

Paste_Image.png

import maven
Paste_Image.png

配置工程属性、工程目录、scala库
如下图，左边为项目结构，src 目录下为编写的代码，main为程序代码，test为测试代码。pom.xml文件为maven的打包关联依赖及编译文件

Paste_Image.png

设置scalaSDK
点击file –> project Structure，如下图：

Paste_Image.png

点击Global Libraries, 然后点击左侧 + ，选择Scala SDK，然后再弹出框中选择2.10.4，弹出框的model选择我们的当前工程；

Paste_Image.png

设置scala程序路径
在model –> source 区域，如下图，新建两个scala文件夹，并且，main中的scala文件夹设置为source，test中的scala文件夹设置为test，点击ok完成。

Paste_Image.png

修改pom文件，添加spark支持
修改pom文件后，maven会自行下载对应的jar包，以便实现工程库文件依赖。
一般情况下，我们只需要添加scala-library、spark-core、spark-mllib、spark-sql、spark-hive几个就够了，如果涉及到其他内容，则另行添加便可。添加内容如下所所示：

<dependencies>
     <!-- https://mvnrepository.com/artifact/org.scala-lang/scala-library -->
     <dependency>
         <groupId>org.scala-lang</groupId>
         <artifactId>scala-library</artifactId>
         <version>2.11.8</version>
     </dependency>
     <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core_2.11 -->
     <dependency>
         <groupId>org.apache.spark</groupId>
         <artifactId>spark-core_2.11</artifactId>
         <version>2.1.0</version>
     </dependency>
     <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-mllib_2.11 -->
     <dependency>
         <groupId>org.apache.spark</groupId>
         <artifactId>spark-mllib_2.11</artifactId>
         <version>2.1.0</version>
     </dependency>
     <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql_2.11 -->
     <dependency>
         <groupId>org.apache.spark</groupId>
         <artifactId>spark-sql_2.11</artifactId>
         <version>2.1.0</version>
     </dependency>
     <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-hive_2.11 -->
     <dependency>
         <groupId>org.apache.spark</groupId>
         <artifactId>spark-hive_2.11</artifactId>
         <version>2.1.0</version>
     </dependency>
 </dependencies>

添加完后pom文件截图如下所示，maven会自行下载对应库（需要联网），并依赖到工程中。修改完后的pom文件如下所示：

Paste_Image.png

工程重新构建完毕后，可以看见maven下载的关联包如下图所示：

Paste_Image.png

编写helloworld

在src ->main ->scala 目录下，点击创建scala class

Paste_Image.png

在弹出框，名字填写为HelloWord ，类型选择为object，然后点击ok

Paste_Image.png

打开新建的程序 helloworld，编写程序如下并保存：

object HelloWord {
  def main(args: Array[String]) {
    println("Hello World!");
  }
}

-右键点击 HelloWord 程序代码，点击 run HelloWord ：

Paste_Image.png

待编译完成后，执行结果如下图：

Paste_Image.png

IDEA SPARK SCALA 搭建简单的helloworld

新建maven工程：

配置工程属性、工程目录、scala库

编写helloworld