spark函数基础

最新推荐文章于 2023-12-21 08:28:53 发布

原创最新推荐文章于 2023-12-21 08:28:53 发布 · 448 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#spark #大数据 #big data

二元组置换（特殊）

val t=new t1[String,Int]("chen",26)//val t=("chen",26)

println(t._1,t._2)

val swap: (Int, String) = t.swap//置换,二元组特殊方法，其他没有

println(swap._1,swap._2)

println(swap._1)

部分函数

def alarmMsg(title:String,content:String,height:Double):Unit={

println(title+"\t"+content+":"+height)

}

alarmMsg("警报","空气甲醛浓度",21.42d)--->警报空气甲醛浓度为:21.42

val title="警报"

def alarmMsg2=alarmMsg(title,content:String,height:Double)

alarmMsg2("空气甲醛浓度为：",21.43d)---> 警报空气甲醛浓度为:21.32

def alarmMsg3=alarmMsg(content,height:Double)

alarmMsg3(12.45d) ---> 警报空气甲醛浓度为:21.32

偏函数

def funPartition2:PartialFunction[Int,String]={

case 1=>"优秀"

case 2=>"良好"

case 3=>"合格"

case _=>"不及格"

}

println(funPartition2(3))---->合格

println(funPartition2(4))---->不及格

val arr:Array[Int]=Array(1,3,4,3,2)

val strings:Array[String] = arr.collect(funPartition2)

遍历

println(strings.toList)

或

for(in<-strings){

println(in)

}

函数作为返回值

def funTest():(String,String)=>String={

def funDemo(str:String,str1:String):String={

str+"@@"+str1

}

funDemo

}

println(funTest()("hello","world"))

函数作为参数

def funTest1(f:(Int,Int)=>Int)):Int={

val a=100

val b=50

f(a,b)

}

val sum=(a:Int,b:Int)=>a+b

val ji=(a:Int,b:Int)=>a*b

println(sum(2,3))---->5

println(funTest(sum)))---->150

println(funTest(ji)))---->5000

递归函数

def ji(num:Int):Int{

if(num==1) 1

else num*ji(num-1)

}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

s_schen

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

Spark处理大数据的常用函数（开窗函数）

xujonas的博客

11-05

1463

spark数据开窗函数、rank、row_number、dense_rank排序函数、lead、lag、取指定行某一字段值、分区范围、开窗方法

Spark 基础函数

gcangle的专栏

09-24

667

创建RDD 根据内容parallelize ()： Line = sc.parallelize(["pandas", "Ilike pandas"]) 根据文本文件 textFile()： inputRDD = sc.textFile("log.txt") 映射RDD 一对一映射 map(): 将每个数据项变换后形成新的数据项作为结果 num = sc.p

参与评论您还未登录，请先登录后发表或查看评论

Spark学习：基础函数功能解读

znb769525443的专栏

11-15

536

参考：http://blog.youkuaiyun.com/yunlong34574/article/details/38635853 原作者最后几句代码有问题，我已经修改

【核心API开发】Spark入门教程[3]

weixin_33775572的博客

09-12

276

本教程源于2016年3月出版书籍《Spark原理、机制及应用》，在此以知识共享为初衷公开部分内容，如有兴趣，请支持正版书籍。 Spark综合了前人分布式数据处理架构和语言的优缺点，使用简洁、一致的函数式语言Scala作为主要开发语言，同时为了方便更多语言背景的人使用，还支持Java、Python和R语言。Spark因为其弹性分布式数据集（RDD）的抽象数据...

Spark基本函数操作实例

LongfeiZhou的博客

05-19

690

这是编写spark程序的一些常用的基本函数接下来我将会通过编写代码来使用这些函数package com.zlf.sparkimport org.apache.spark.SparkContext import org.apache.spark.SparkConf /** * spark 基本函数操作实例 */ object FunctionTest { def main(args:

精选资源

《Spark编程基础及项目实践》试卷及答案2套.pdf

04-04

【Spark编程基础及项目实践】试卷涉及的知识点涵盖了Spark的核心概念、大数据处理、Scala语言基础以及Spark的部署和运行模式。以下是对这些知识点的详细解释： 1. **大数据的特征**：大数据通常具有Volume（大量）...

《Spark编程基础及项目实践》课后习题及答案4.pdf

04-04

《Spark编程基础及项目实践》课后习题与答案涵盖了Spark的核心概念，主要涉及RDD（弹性分布式数据集）的操作和编程模型。以下是基于题目内容展开的详细知识点解析： 1. **RDD（Resilient Distributed Dataset）**：...

《Spark 编程基础》教材讲义厦门大学林子雨

04-03

Scala是一种多范式编程语言，它结合了面向对象和函数式编程的特点，使得Spark代码既能够保持清晰的结构，又能够实现高效的并行计算。第3章《Spark的设计与运行原理》深入探讨了Spark的架构和核心组件，如RDD（弹性...

《Spark编程基础及项目实践》课后习题及答案7.pdf

04-04

- **创建图**：在Spark Shell中，可以使用`sc.textFile`读取文本数据，然后通过`map`函数处理数据，构建`Edge`对象，最后通过`Graph.fromEdges`创建图。示例代码展示了如何从文本文件生成包含自定义顶点属性和边...

精选资源

《Spark编程基础及项目实践》课后答案.zip

05-13

《Spark编程基础及项目实践》课程的课后答案涵盖了Spark的核心概念、主要功能以及在实际项目中的应用。这个压缩包包含的资源旨在帮助学生深入理解并掌握Spark编程的关键知识点。一、Spark概述 Spark是大数据处理...

Spark基本函数学习

weixin_30724853的博客

08-21

117

package cn.itcast.spark.czhimport org.apache.spark.{SparkConf, SparkContext}object TestFun { def main(args: Array[String]): Unit = { val conf = new SparkConf().setMaster("local").setAppName("map")...

SparkSQL函数操作

HYSliuliuliu的博客

12-21

7839

SQL中函数，其实说白了就是各大编程语言中的函数，或者方法，就是对某一特定功能的封装，通过它可以完成较为复杂的统计。这里的函数的学习，就基于Hive中的函数来学习。概述当系统提供的这些函数，满足不了咱们的需要的话，就只能进行自定义相关的函数，一般自定义的函数两种，UDF和UDAF。UDF一路输入，一路输出，完成就是基于scala函数。通过模拟获取字符串长度的udf来学习自定义udf操作。代码实现// 创建执行入口// 导入隐式转换及构建数据"yukailu","maningna"))

Spark入门教程（非常详细）从零基础入门到精通，看完这一篇就够了

热门推荐

Javachichi的博客

07-23

13万+

Hive 是将 SQL 转为 MapReduce。SparkSQL 可以理解成是将 SQL 解析成：“RDD + 优化” 再执行在学习Spark SQL前，需要了解数据分类。

条件判断：IF函数

Chevy0707的博客

06-18

531

目的：判断成绩所属的等次。方法： 1、选定目标单元格。 2、在目标单元格中输入公式：=IF(C3>=90,"优秀",IF(C3>=80,"良好",IF(C3>=60,"及格","不及格")))。 3、Ctrl+Enter填充。解读： IF函数是条件判断函数，根据判断结果返回对应的值，如果判断条件为TRUE，则返回第一个参数，如果为FALSE，则返回第二个...

scala基础语法-----Spark基础

Simple的博客

02-25

1226

注：最近在上网课，然后这学期开了一门spark，以下文字来自课堂发的资料，不知道发在这上面算不算侵权，主要是为了自己复习方便，侵权删。然后我根据上课内容进行了一些练习，代码在最下方。 scala基本语法我们可以根据scala 菜鸟教程来学习地址为： https://www.runoob.com/scala/scala-tutorial.htm 1.变量声明 /** ...

spark分组排序一

huyang0101的博客

12-16

1858

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、样例数据二、样例源码三、总结思路问题前言以一个小例子：统计每个品类下最受欢迎的sku，来记录下spark分组排序的思路。此代码是参考多易教育spark课程编写一、样例数据 cate1,sku01 cate1,sku02 cate1,sku01 cate1,sk

spark将DF的一列转成list

杨羊不是羊的博客

09-07

3908

使用collect之后要取map里第0个元素 select("ad_id").collect().map(_(0)).toList

Spark dataframe与list的转换(多行变一行)

Buevara的博客

10-29

2万+

Scala 强大的集合数据操作示例

05-23

9万+

Scala是数据挖掘算法领域最有力的编程语言之一，语言本身是面向函数，这也符合了数据挖掘算法的常用场景：在原始数据集上应用一系列的变换，语言本身也对集合操作提供了众多强大的函数，本文将以List类型为例子，介绍常见的集合变换操作。一、常用操作符（操作符其实也是函数）++ ++[B](that: GenTraversableOnce[B]): List[B] 从列表的尾部添加另外一个列表++: ++:

spark函数