- 博客(8)
- 收藏
- 关注
原创 Ubuntu20.04安装MySQL 8.0最新版
mysql-client_8.0.27-1ubuntu20.04_amd64.deb mysql-community-client_8.0.27-1ubuntu20.04_amd64.deb , 要安 装的是第⼀个不带 community 的这个 ( 因为之前安装了 community 版本还是报这个错,安装 mysql-community-server_8.0.27-1ubuntu20.04_amd64.deb 这个包。解压完后的 deb 包都是红⾊的,没有执⾏权限,所以给他们添加执⾏权限。
2025-03-22 18:14:02
637
原创 TopN问题分析和单元实践练习
比如,文件的原始内容是四行字符串(即"1111"、"2222"、"3333"、"4444"),得到的新 RDD 里面的元素应为(1111, 1111, 3333, 2222)。[("张婷","女",19,"2019 级"),("李婉","女",20, "2019 级")("刘思思","男",22,"2018 级")](1)有一个元组(1,2,3,4,5),请使用 Spark 的 map()将其转换为一系列元组的集合:(0,1,1), (0,4,2),提示:先 sortBy(),再 filter()。
2025-03-22 18:08:52
625
原创 RDD的创建和转换操作
如图所示,如果只有jps,而没有其他的进程,说明hdfs没有启动,如果有红圈中的相关进程,说明启动成功,不用进行此步骤。stu=["张婷,女,19,2019级","李婉,女,20,2019级","刘思思,男,22,2018级"]stu=["张婷,女,19,2019级","李婉,女,20,2019级","刘思思,男,22,2018级"]使用parallelize()方法从普通集合元素创建RDD。如果报错 可能代码错误 或超出范围 重在理解。完成后quit()回车,退出pyspark。红色代码可以直接复制。
2025-03-21 22:47:37
705
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人