spark
0基础学习spark的一些笔记总结
叫我王富贵i
24届专科毕业大数据技术
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
利用pyspark实现运行sql文件
【代码】利用pyspark实现运行sql文件。原创 2024-09-02 13:49:46 · 731 阅读 · 0 评论 -
请编写代码,针对words.txt文本(此文本已经存储在HDFS的/pydata/input/文件夹下)进行词频计算。要求1,将词频统计的结果存储在HDFS的/pydata/output5/路径下
请编写代码,针对words.txt文本(此文本已经存储在HDFS的/pydata/input/文件夹下)进行词频计算。前三:[('hadoop', 10), ('hello', 10), ('hive', 9)]要求2,统计词频前三的单词,统计词频最高的单词,统计词频最低的单词,呈现结果如下。最高:('hadoop', 10)最低:('world', 4)原创 2024-08-27 09:59:16 · 357 阅读 · 0 评论 -
0基础学习spark
0基础学习spark的一些笔记和总结原创 2024-08-26 15:45:04 · 1832 阅读 · 0 评论 -
JAVA_HOME is not setTraceback (most recent call last): File “/export/data/workspace/pyspark_paren
JAVA_HOME is not setTraceback (most recent call last): File "/export/data/workspace/pyspark_paren原创 2024-08-17 13:11:00 · 445 阅读 · 0 评论
分享