自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_52564218的博客

原创 11.4 DataFrame

df.selectExpr("id as ID").show() //设置了一个别名ID。df.select("id").show() //选择“id”列。.appName("Spark SQL basic example") //设置会话名称。.appName("Spark SQL basic example") //设置会话名称。

2024-09-20 16:50:53 653 1

原创 11.5 Spark SQL

/步3：第一次使用map对每一行进行split，第二次使用map将数据封装到Bean中,最后使用toDF转换成DataFrame。/** 步1：声明JavaBean，并直接声明主构造方法 * */（1）给DataFrame设置别名（一行代码一行代码运行）/** 声明无参数的构造，调用主构造方法 * *///步4：显示或是保存数据。

2024-09-20 16:50:34 1842

原创 11.6 Spark Streaming

(8)IDEA打开Streaming2.scala,设置自己的hdfs地址,可以使用以下代码查看在虚拟机,并且更改IDEA第7 12行的代码。（1）打开FileStreaming.scala文件，使用Maven打包，并且复制到app文件夹下。打开DStreaming.scala，修改19行的ip地址改成自己的，并且运行。(2) 打开文件WindowFun.scal,修改主机名为自己的,并且运行。(2) 打开虚拟机,配置镜像文件,如果配置过,请忽略此步骤。运行打包的项目，根据自己的位置和端口进行修改。

2024-09-20 16:50:18 1716 1

原创 11.3 spark-submit

在本地windows中，打开WordCount2.scala，使用11.2节最后面的maven打包方式进行打包，并且把包传到虚拟机，可以新建一个文件夹，但是后面的路径需要跟文件的路径一致。在虚拟机打开hadoop，在命令行中输入。1.使用spark-submit提交。

2024-09-20 16:49:59 421

原创 11.2使用Scala开发Spark应用

安装好后，正确配置系统环境测试安装结果：打开IntelliJ IDEA ，下载scala。

2024-09-20 16:49:21 1872

原创 11.1安装Spark

下载文件名：spark-3.1.1-bin-without-hadoop.tgz11.1.1本地模式安装。

2024-09-20 16:49:03 836

原创基于ARIMA模型预测中国GDP及全国GDP可视化

GDP可视化

2023-03-10 19:36:00 798

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

勇敢de大角牛优快云认证博客专家优快云认证企业博客

码龄4年

IP 属地：四川省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

142万+: 周排名

18万+: 总排名

8138: 访问

: 等级

184: 积分

90: 粉丝

110: 获赞

0: 评论

141: 收藏

私信

关注

热门文章

分类专栏

spark 6篇

最新评论

11.4 DataFrame
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
11.6 Spark Streaming
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

提示

确定要删除当前文章？

取消删除