自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 spark 知识总结

spark知识总结

2025-04-15 13:29:05 516

原创 Spark上安装MySQL

Spark上安装MySQL

2025-03-31 21:27:08 251

原创 Jupyter远程密码设置和访问

Jupyter远程密码设置和访问

2025-03-31 21:18:14 269

原创 Ubuntu20.04安装MySQL 8.0最新版

mysql-client_8.0.27-1ubuntu20.04_amd64.deb mysql-community-client_8.0.27-1ubuntu20.04_amd64.deb , 要安 装的是第⼀个不带 community 的这个 ( 因为之前安装了 community 版本还是报这个错,安装 mysql-community-server_8.0.27-1ubuntu20.04_amd64.deb 这个包。解压完后的 deb 包都是红⾊的,没有执⾏权限,所以给他们添加执⾏权限。

2025-03-22 18:14:02 637

原创 TopN问题分析和单元实践练习

比如,文件的原始内容是四行字符串(即"1111"、"2222"、"3333"、"4444"),得到的新 RDD 里面的元素应为(1111, 1111, 3333, 2222)。[("张婷","女",19,"2019 级"),("李婉","女",20, "2019 级")("刘思思","男",22,"2018 级")](1)有一个元组(1,2,3,4,5),请使用 Spark 的 map()将其转换为一系列元组的集合:(0,1,1), (0,4,2),提示:先 sortBy(),再 filter()。

2025-03-22 18:08:52 625

原创 RDD转换行动操作和词频统计

rdd

2025-03-22 18:01:39 539

原创 RDD的创建和转换操作

如图所示,如果只有jps,而没有其他的进程,说明hdfs没有启动,如果有红圈中的相关进程,说明启动成功,不用进行此步骤。stu=["张婷,女,19,2019级","李婉,女,20,2019级","刘思思,男,22,2018级"]stu=["张婷,女,19,2019级","李婉,女,20,2019级","刘思思,男,22,2018级"]使用parallelize()方法从普通集合元素创建RDD。如果报错 可能代码错误 或超出范围 重在理解。完成后quit()回车,退出pyspark。红色代码可以直接复制。

2025-03-21 22:47:37 705

原创 Spark环境搭建与配置

spark环境搭建和配置

2025-03-19 20:17:54 1105

Spark-SQL.rar

spark

2025-04-15

Ubuntu20.04安装MySQL8.0离线版

Ubuntu20.04安装MySQL8.0离线版

2025-03-22

TopN问题分析和单元实践练习

TopN问题分析和单元实践练习

2025-03-16

RDD转换行动操作和词频统计

RDD转换行动操作和词频统计

2025-03-08

RDD的创建和转换操作

RDD的创建和转换操作

2025-03-08

Jupyter远程密码设置和远程访问

Jupyter远程密码设置、Jupyter远程访问

2025-03-03

spark环境搭建和配置(hadoop、jdk、spark)

spark环境搭建和配置(hadoop、jdk、spark)

2025-03-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除