Spark 通过Rdd进行倒叙排序

最新推荐文章于 2024-06-25 17:05:19 发布

原创最新推荐文章于 2024-06-25 17:05:19 发布 · 2.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

Spark 专栏收录该内容

31 篇文章

订阅专栏

本文详细介绍使用Apache Spark进行大规模数据处理的技术细节，包括如何通过SparkConf配置Spark环境，创建SparkContext对象，读取文本文件，使用map操作转换数据，并通过sortBy进行排序。此外，还展示了如何在Spark中设置Hadoop目录路径。

测试数据：
1 1603A 95
2 1603B 85
3 1603C 75
4 1603D 96
5 1604F 94
6 1604E 95
7 1604K 91
8 1604G 89
9 1501A 79
10 1502A 69
11 1503A 59
12 1504A 89
13 1701A 99
14 1702A 100
15 1703A 65

测试结果：
(1702A,100)
(1701A,99)
(1603D,96)
(1603A,95)
(1604E,95)
(1604F,94)
(1604K,91)
(1604G,89)
(1504A,89)
(1603B,85)
(1501A,79)
(1603C,75)
(1502A,69)
(1703A,65)
(1503A,59)

package com.spark.week3

import org.apache.spark.{SparkConf, SparkContext}

object Four {

  System.setProperty("hadoop.home.dir","D:/soft/hadoop/hadoop-2.7.3")

  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setMaster("local").setAppName("Week4Class")
    val df = new SparkContext(conf)
    val fileRdd = df.textFile("G:/data/week3class.txt")

	//方式一
//    fileRdd.map(line => {
//      val row= line.split(" ")
//      (row(1),row(2).toInt)
//
//    }).sortBy(line => line._2,false).foreach(println)

    fileRdd.map(line=> (line.split(" ")(1),line.split(" ")(2).toInt)).sortBy(line=>line._2,false).foreach(println)


    df.stop()

  }

}

博客等级

码龄6年

53
原创

12
点赞

113
收藏

10
粉丝

关注

私信

热门文章

分类专栏

Hadoop 11篇
kafka 1篇
sqoop 1篇
flume 1篇
Spark 31篇
Scala 4篇
Linux 3篇
hdfs 1篇
Hive 2篇

展开全部收起

上一篇：: Spark 使用UDAF获取平均值

下一篇：: sparkStreming流式处理接受socket数据，实现单词统计

最新评论

Sqoop 导入数据的基本案例
优快云-Ada助手: 非常感谢优快云博主分享关于Sqoop导入数据的基本案例，这篇博客非常实用，我觉得对于那些需要使用Sqoop进行数据导入的用户来说，这篇博客是非常有价值的。下一篇博客，我建议可以写一篇关于Sqoop导出数据的技术文章，探讨在实际项目中如何使用Sqoop进行数据导出，相信会有更多读者受益。期待更多精彩的技术分享！为了方便博主创作，提高生产力，优快云上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.youkuaiyun.com/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.youkuaiyun.com/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。