
Spark
文章平均质量分 51
记录Spark学习遇到的问题和代码
UserOrz
这个作者很懒,什么都没留下…
展开
-
实验四 Spark程序设计进阶
Spark影评实战,使用Spark各种RDD算子处理实际问题原创 2022-04-04 23:53:18 · 2088 阅读 · 3 评论 -
实验三 初步掌握Spark程序设计
1. 统计文本中性别为“男”的用户数。文件格式如图package com.spark.homework.initSparkimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.rdd.RDDobject count_male { def main(args: Array[String]): Unit = { // TODO 建立和Spark框架的连接 val原创 2022-03-22 16:04:06 · 3355 阅读 · 1 评论 -
Windows下PyCharm远程连接Spark
我这里的spark部署在虚拟机内,使用的版本为: python3.8 hadoop3.3 spark3.2 java8为了防止报错,在windows环境我也安装了python3.8和虚拟机同步此时linux集群已经部署好了spark环境1、配置Hadoop DLL在编写spark时可能会用到hadoop的一些功能,所以需要配置hadoop的运行环境文件可以在github上下载,https://github.com/cdarlint/winutils因为没有对应的hadoop版本,我用的原创 2022-03-03 19:38:36 · 3908 阅读 · 1 评论 -
实验二 Scala程序设计进阶
1、构造Person类。包括姓名(name),性别(sex)和年龄(age)。提供所有属性的set和get函数,提供print函数打印其信息;构造Student类继承Person类,并增加学校(school),学号(studentID)。并对其进行测试。package com.spark.core.wcobject Test { def main(args: Array[String]): Unit = { //测试Person类 val person = ne原创 2022-03-02 10:30:53 · 522 阅读 · 0 评论 -
Exception in thread “main“ java.lang.NoSuchMethodError: scala.Predef$.refArrayOps
使用IDEA工具运行SparkStreaming的WordCount时,运行报错,报错信息如下:Exception in thread "main" java.lang.NoSuchMethodError: scala.Predef$.refArrayOps([Ljava/lang/Object;)Lscala/collection/mutable/ArrayOps; at org.apache.spark.util.Utils$.getCallSite(Utils.scala:1406) at or原创 2022-02-23 23:04:11 · 2503 阅读 · 0 评论 -
实验一 初步掌握Scala程序设计
可否定义一个sum函数呢?返回指定区间的值的和?例如,区间[1,4]的和为1+2+3+4=10返回指定区间值的平方的和呢?立方呢?package com.spark.core.wcimport scala.io.Sourceobject temp { def main(args: Array[String]): Unit = { val x,y = readInt(); print(sum((i:Int)=>i,x,y)); //若要平方则改为sum((i:I.原创 2022-02-23 22:09:57 · 1091 阅读 · 0 评论