Spark实操------ wordcount实现

最新推荐文章于 2024-09-16 10:02:09 发布

原创最新推荐文章于 2024-09-16 10:02:09 发布 · 301 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Spark 同时被 3 个专栏收录

1 篇文章

订阅专栏

1 篇文章

订阅专栏

0 篇文章

订阅专栏

本文详细介绍如何在Linux环境下使用Hadoop和Spark进行文本文件的创建、上传至HDFS、读取及处理流程。从创建文件到利用Spark进行文本分析，提供了一套完整的操作指南。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

创建文件：

在Linux文件夹下，进如要文件的目录：输入vi test.txt

按i输入文本内容，输入完毕按esc，按:wq 保存退出

然后在命令行执行下面的命令：

hadoop fs –mkdir –p /Hadoop/Input （在HDFS创建目录）

hadoop fs –put test.txt /Hadoop/Input （将test.txt文件上传到HDFS）

hadoop fs –ls /Hadoop/Input （查看上传的文件）

hadoop fs –text /Hadoop/Input/test.txt （查看文件的内容）

启动spark

spark-shell

输入下面的语句：

val file=sc.textFile(“/Hadoop/Input/test.txt”)

val rdd = file.flatMap(line => line.split(“ ”)).map(word => (word,1)).reduceByKey(_+_)

val maps = rdd.collect()

for (i <- 0 to maps.length-1) {

println(maps(i))

}

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。