自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 11.4 DataFrame

df.selectExpr("id as ID").show() //设置了一个别名ID。df.select("id").show() //选择“id”列。.appName("Spark SQL basic example") //设置会话名称。.appName("Spark SQL basic example") //设置会话名称。

2024-09-20 16:50:53 653 1

原创 11.5 Spark SQL

/步3:第一次使用map对每一行进行split,第二次使用map将数据封装到Bean中,最后使用toDF转换成DataFrame。/** 步1:声明JavaBean,并直接声明主构造方法 * */(1) 给DataFrame设置别名(一行代码一行代码运行)/** 声明无参数的构造,调用主构造方法 * *///步4:显示或是保存数据。

2024-09-20 16:50:34 1842

原创 11.6 Spark Streaming

(8)IDEA打开Streaming2.scala,设置自己的hdfs地址,可以使用以下代码查看在虚拟机,并且更改IDEA第7 12行的代码。(1)打开FileStreaming.scala文件,使用Maven打包,并且复制到app文件夹下。打开DStreaming.scala,修改19行的ip地址改成自己的,并且运行。(2) 打开文件WindowFun.scal,修改主机名为自己的,并且运行。(2) 打开虚拟机,配置镜像文件,如果配置过,请忽略此步骤。运行打包的项目,根据自己的位置和端口进行修改。

2024-09-20 16:50:18 1716 1

原创 11.3 spark-submit

在本地windows中,打开WordCount2.scala,使用11.2节最后面的maven打包方式进行打包,并且把包传到虚拟机,可以新建一个文件夹,但是后面的路径需要跟文件的路径一致。在虚拟机打开hadoop,在命令行中输入。1.使用spark-submit提交。

2024-09-20 16:49:59 421

原创 11.2使用Scala开发Spark应用

安装好后,正确配置系统环境测试安装结果:打开IntelliJ IDEA ,下载scala。

2024-09-20 16:49:21 1872

原创 11.1安装Spark

下载文件名:spark-3.1.1-bin-without-hadoop.tgz11.1.1本地模式安装。

2024-09-20 16:49:03 836

原创 基于ARIMA模型预测中国GDP及全国GDP可视化

GDP可视化

2023-03-10 19:36:00 798

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除