Intellij IDEA创建spark项目

本文详细介绍了如何在Windows上下载、安装Scala和Spark,并配置环境变量。通过命令行验证安装成功后,展示了创建Scala项目的过程,包括导入Scala SDK、安装Scala插件以及引入Spark的jar包。接着,编写了一个简单的WordCount程序,用于读取并过滤文件中的特定内容,统计出现次数,最后将结果保存到指定文件。程序适用于初学者理解Scala和Spark的基本操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

环境搭建

  • hadoop-2.7.5
  • scala-2.12.7
  • spark-3.3.0
  • JDK 1.8.0

官网下载安装ScalaSpark并配置windows环境变量:

下载后解压,然后配置环境变量,版本要适配不然运行程序时可能会报错

scala下载:

image-20220817202415022

本帖所安装的版本为scala-2.12.7可自行安装其他版本

进入自己所选择的版本,滑到下边,选择Windows版

image-20220817202748410

下载到随便一个没有中文字符的目录并解压出来

image-20220817202908393

右键属性此电脑,打开高级设置添加系统环境变量

image-20220817205948210

image-20220817205826586

打开命令提示符小黑窗,输入

scala -version

出现版本号说明已经安装配置成功

image-20220817210431801

spark下载:

image-20220817210738127

本帖所安装的版本为spark-3.3.0-bin-hadoop2可自行安装其他版本

进入所选的版本,再次选择自己所需要下载的文件

image-20220817211521461

下载到随便一个没有中文字符的目录并解压出来

image-20220817211609513

右键属性此电脑,打开高级设置添加系统环境变量

image-20220817212056809

image-20220817212400941

配置完后打开命令提示符小黑窗,输入

spark-shell

出现版本号说明已经安装配置成功

image-20220817212618222

创建Scala项目

image-20220817213134689

Scala SDK:点击创建—>浏览—>选择自己Scala目录—>确定

image-20220817213427692

安装Scala插件,这里我已经下载过了 没下载的直接点Install等待下载安装完成再操作

image-20220817213620843

导入spark的jar包

image-20220817214153932

创建一个Scala类

image-20220817214539007

运行第一个WordCount程序:

对spark1.txt文件进行筛选,将A或者包含A的字母筛选出来并统计个数,然后输出到dome1文件中。

#数据如下
id	编号	内容
A	B	C
AB	A	B
C	A	B
AB	AB	AB

image-20220817215003033

image-20220817215013798

import org.apache.spark.{SparkConf, SparkContext}

object demo {
  def main(args: Array[String]): Unit = {
    var sparkConf = new SparkConf().setAppName("demo1").setMaster("local")
    var sc = new SparkContext(sparkConf)
//    文件输入路径
    var filepath = "F:\\test\\spark_work\\input\\spark1.txt"
    //获取第一行
    var fileFirst = sc.textFile(filepath).first()

    sc.textFile(filepath).filter(!_.equals(fileFirst)).flatMap(_.split("\t")).filter(_.contains("A"))
//      文件输出路径,该目录自主创建会导致报错,程序运行后它会自动创建该目录
      .map((_,1)).reduceByKey(_+_).saveAsTextFile("F:\\test\\spark_work\\output")
  }
}
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值