scala中的函数组合器map,foreach,flatmap,flatten，filter，zip等用法

最新推荐文章于 2025-03-09 15:14:05 发布

原创最新推荐文章于 2025-03-09 15:14:05 发布 · 1.8w 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#scala #filter #flatmap

scala 专栏收录该内容

16 篇文章

订阅专栏

本文深入解析Scala中常用集合操作方法，包括map用于映射生成新集合，foreach用于执行操作不返回值，flatten用于展开嵌套集合，flatMap结合map和flatten特性，filter用于过滤元素，zip和zipWithIndex用于组合两个集合或集合与索引。提供详细示例和解释。

1、map

map方法可以将某个函数应用到集合中的每个元素并产出其结果的集合，比如

val names=List("a","b","c")

可以用

names.map(_.toUpperCase)

得到List("A","B","C")

2、foreach

foreach和map相似，只不过它没有返回值，foreach只要是为了对参数进行作用。

比如 names.foreach{name=>println(name)}

3、flatten

flatten可以把嵌套的结构展开.

scala> List(List(1,2),List(3,4)).flatten
res0: List[Int] = List(1, 2, 3, 4)

4、flatmap

flatMap结合了map和flatten的功能。接收一个可以处理嵌套列表的函数，然后把返回结果连接起来。

scala> List(List(1,2),List(3,4)).flatMap(x=>x.map(x=>x*2))
res5: List[Int] = List(2, 4, 6, 8)

5.filter

滤除掉使函数返回false的元素

scala> def isEven(i: Int): Boolean = i % 2 == 0
isEven: (i: Int)Boolean
scala> List(1,2,3,4).filter(isEven _)
res6: List[Int] = List(2, 4)

6.zip

zip方法将两个集合结合在一起

scala> List('a,'b,'c).zip(List(1,2,3))
res32: List[(Symbol, Int)] = List(('a,1), ('b,2), ('c,3))

zipWithIndex将元素和下标结合在一起

scala> List(2,3,4,5).zipWithIndex
res33: List[(Int, Int)] = List((2,0), (3,1), (4,2), (5,3))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

springlustre

关注关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

8、Scala 函数式编程：函数与集合操作全解析（上）

z4a5b6的博客

09-24

本文深入解析了Scala中的函数式编程核心概念，涵盖函数定义与特性、函数组合与抽象、函数粒度控制、不可变集合的高阶函数操作（如map、flatMap、foreach和for推导式），以及如何结合Option类型安全处理可能为空的值。通过对比命令式与声明式编程，展示了Scala在提升代码可读性、可维护性和健壮性方面的优势，是掌握Scala函数式编程的全面指南。

Scala(10) -- scala的数组、元组、列表、集、映射、迭代器、函数式编程

erainm

09-21

654

1. 数组 2. 元组 3. 列表 4. 集 5. 映射 6. 迭代器(iterator) 7. 函数式编程 8. 案例

参与评论您还未登录，请先登录后发表或查看评论

Scala中的`map`操作详解及示例

DevPulse的博客

09-12

544

在这个示例中，我们定义了一个Person类表示人员的信息，然后创建了一个包含多个Person对象的列表people。接下来，我们使用map操作将列表中的每个Person对象转换为其姓名，并存储在新的列表names中。最后，我们打印出结果列表names。本文详细介绍了Scala中的map操作及其语法。我们通过几个示例演示了map操作在不同场景下的应用，包括对数字列表的平方操作、对字符串列表的转换操作，以及对自定义对象的转换操作。map。

Scala中的map函数

2301_77836489的博客

06-22

886

Scala中的map函数

Scala中map 函数

2401_87129116的博客

10-15

398

在某些场景下，我们可能会对集合中的所有元素进行变换；map方法可以将某个函数应用到集合中的每个元素并产出其结果的集合。

scala第十四讲：Map

美丽的泡沫

12-27

2752

Map(映射)是一种可迭代的键值对（key/value）结构。特点： 1）Map的键是唯一的 2）Map的类型分可变和不可变，默认是不可变的一：定义：空Map定义：var A:Map[Char,Int]=Map() 有键值的定义：val B=Map('a'->'b','c'->'d') 给空Map填加key、value：A += ('I' -> 1)

Scala之map操作

说文科技，做有态度的研究。

03-18

3273

object Test{ def main(args : Array[String]): Unit ={ System.out.println("Print the operation in for circulation of String-------") val str : String = "he llo" for(c <- str) pri...

scala集合中的函数详解大全(一)

Fresh_man888的博客

11-04

1540

0 目录 1.foreach函数 2.map函数 3.filter和filterNot(过滤函数) 4.collect函数 5.min和max 6.minBy和maxBy 7. sum函数 8. find 函数 9. flatten 函数 10flatMap函数 11mapValues 函数 12sorted函数 13sortBy和sortWith 函数 14.partition和span 函数 15grouped 函数和groupBy函数 1.for...

scala 数组函数大全（143个1个不漏，全面案例详解）

BigData_Hubert的博客

09-09

6227

scala系列 scala 143个数组函数大全 scala 数组函数大全scala系列前言一、scala 数据简介二、数组函数汇总前言本篇博客为大家带来的是 scala 所有（没错，没有看错，就是所有）数组函数的案例详解大全。scala 数组函数是 scala 能够实现代码飘逸的核心基础所在，因此在 scala 入门的时候必须强记下来，没有任何商量的余地。相信大家在看完的数组函数汇总后，都能够代码敲的飘逸！“so easy” ![在这里插入图片描述](https://img-blog.

大数据——Scala 元组

大数据爱好者的博客

04-18

1390

Tuple。

scala（13）-----集合（Collection）-------Map(映射)

Marlon1993的博客

07-06

190

Map(映射)是一种可迭代的键值对（key/value）结构。所有的值都可以通过键来获取。 Map 中的键都是唯一的。 Map 也叫哈希表（Hash tables）。 Map 有两种类型，可变与不可变，区别在于可变对象可以修改它，而不可变对象不可以。默认情况下 Scala 使用不可变 Map。如果你需要使用可变集合，你需要显式的引入 import...

Scala中的map()和flatMap()

说文科技，做有态度的研究。

04-10

1916

scala> val arr = Array("My name is LittleLawson","She is Liutt") arr: Array[String] = Array(My name is LittleLawson, She is Liutt) scala> val result1 = arr.flatMap(_.split(",")) result1: Array[...

scala Map函数

m0_58535137的博客

02-13

1389

//映射：集合的映射操作是指将一种数据类型转换为另一种数据类型的过程 object Map函数 { def main(args: Array[String]): Unit = { val list = List(1, 2, 3, 4) println(list) // 将List中的数字转换成对应数字的"*" // 普通方式 val list1 = list.map((x: Int) => { "*" * x }) print

Scala111-map、flatten、flatMap

此心安处是吾乡

03-11

426

Intro map、flatten、flatMap是scala中常用的函数，举几个例子，简单的总结下。 Map map操作是针对集合的变换操作，它将函数应用到集合中的每个元素，并产生一个结果集合。 import scala.collection.mutable.{ListBuffer, ArrayBuffer} import scala.collection.mutable.{ListBuffer, ArrayBuffer} val arr=Array(ArrayBuffer(1),ArrayBuf

Scala中的.map函数

ooopll的博客

03-09

964

map是Scala中用于对集合中的每个元素进行转换的高阶函数。它接收一个函数作为参数，对集合中的每个元素应用该函数，并返回一个包含转换结果的新集合。.map是函数式编程的核心工具之一，能够以简洁的方式实现集合的批量操作。

Scala中的Map和Filter: 提升你的函数式编程技巧

2301_79326930的博客

09-18

264

在本文中，我们深入探讨了Scala中的Map和Filter函数，它们是函数式编程中非常有用的工具。通过使用Map函数，我们可以对集合中的每个元素应用一个函数，并得到一个新的集合。Map函数是一种高阶函数，它接受一个函数作为参数，并将该函数应用到集合的每个元素上，最终返回一个新的集合，其中包含了应用函数后的结果。Filter函数是另一个常用的高阶函数，它接受一个谓词函数（返回布尔值的函数）作为参数，并将该函数应用到集合的每个元素上。函数将列表中的每个元素转换为大写，并获得了一个新的列表。

Scala中的Map 集合详解

m0_51697147的博客

04-20

3265

一、不可变长Map集合 1.map的声明与遍历 2.map的常用方法：get、getOrElse、keys、values、++、++：二、可变长Map集合三、Map的其他方法

Scala map与flatMap

weixin_34128839的博客

08-08

386

1. map函数对集合的每一个元素运用某个函数操作，然后将结果作为一个新的列表返回。实例1：将列表中每个元素值乘以2 scala> val list1=List(1,2,3,4)list1: List[Int] = List(1, 2, 3, 4) scala> list1.map(_*2)res54: List[Int] = List(2, 4, 6, 8)另一种写法：scal...

scala中函数组合器的用法(map,filter,zip,foreach,groupBy,flatten,drop等)

最新发布

09-07

<think> 我们被要求使用函数组合器对Word文件进行词频统计。首先需要明确，Word文件通常指Microsoft Word文档（.doc或.docx），而Scala本身并不直接支持读取Word文件。因此，我们需要借助外部库来读取Word文件的内容，然后再进行词频统计。常用的库有Apache POI（Java库）或者使用Scala的封装库。这里我们将使用Apache POI，因为它功能强大且成熟。步骤： 1. 添加依赖：在build.sbt中添加Apache POI的依赖。 2. 读取Word文件：使用POI读取Word文档，提取文本内容。 3. 文本预处理：去除标点、转换为小写等（可选，根据需求）。 4. 使用函数组合器进行词频统计：将文本分割成单词，然后使用flatMap、map、groupBy等组合器进行统计。具体步骤：第一步：添加依赖在build.sbt中添加： libraryDependencies += "org.apache.poi" % "poi" % "5.2.3" libraryDependencies += "org.apache.poi" % "poi-ooxml" % "5.2.3" 第二步：读取Word文件使用POI读取.docx文件（如果是.doc文件，使用HWPF组件，这里以.docx为例）。第三步：词频统计使用函数组合器：flatMap分割单词，map转换为(单词,1)，groupBy分组，然后mapValues计算每个组的长度。但是，我们也可以使用更高效的方式，例如使用`groupMapReduce`（Scala 2.13及以上版本）一步完成。代码示例（假设我们有一个Word文件路径）：注意：以下代码需要Scala 2.13及以上版本，因为使用了`groupMapReduce`。如果版本较低，可以使用`groupBy`和`mapValues`的组合。我们以Scala 2.13为例：示例代码： ```scala import org.apache.poi.xwpf.usermodel.{XWPFDocument, XWPFParagraph} import java.io.FileInputStream object WordFileWordCount { def main(args: Array[String]): Unit = { // 文件路径 val filePath = "path/to/your/file.docx" // 读取Word文件 val doc = new XWPFDocument(new FileInputStream(filePath)) // 提取所有段落文本 val paragraphs = doc.getParagraphs.toArray.toList.asInstanceOf[List[XWPFParagraph]] val texts = paragraphs.map(_.getText) // 关闭文档 doc.close() // 将所有段落合并为一个字符串，并转换为小写（可选） val text = texts.mkString("\n").toLowerCase // 预处理：去除标点符号（只保留字母和空格） val cleanText = text.replaceAll("[^a-zA-Z\\s]", "") // 使用函数组合器进行词频统计 // 分割单词，注意可能存在多个空格，使用\\s+分割 val words = cleanText.split("\\s+").toList // 使用groupMapReduce（Scala 2.13+） // 分组：按单词本身，映射：每个单词映射为1，规约：相同单词的计数相加 val wordCounts = words.groupMapReduce(identity)(_ => 1)(_ + _) // 打印结果 wordCounts.foreach(println) } } ``` 如果是Scala 2.12或更早版本，可以用： ```scala val wordCounts = words.groupBy(identity).mapValues(_.size) ``` 但是，使用`groupMapReduce`更高效，因为它可以一步完成，避免创建中间列表。预处理步骤可以根据需要调整，比如是否转换为小写，是否去除数字等。现在，我们来回答问题：使用函数组合器对Word文件进行词频统计的方法如上所示。注意：读取Word文件部分依赖于POI库，而词频统计部分使用了函数组合器。另外，如果文件很大，可能需要考虑流式处理，但这里我们假设文件不大。最后，生成相关问题： </think> ### Scala使用函数组合器对Word文件进行词频统计以下是使用Scala函数组合器处理Word文件（.docx）进行词频统计的完整方案，结合Apache POI库读取文件内容： #### 1. 添加依赖（build.sbt） ```scala libraryDependencies ++= Seq( "org.apache.poi" % "poi" % "5.2.3", "org.apache.poi" % "poi-ooxml" % "5.2.3" ) ``` #### 2. 完整代码实现 ```scala import org.apache.poi.xwpf.usermodel.XWPFDocument import java.io.FileInputStream import scala.util.Try object WordFileWordCount { def main(args: Array[String]): Unit = { val filePath = "path/to/your/file.docx" // Word文件路径 // 1. 读取Word文件内容 val textContent = readWordFile(filePath).getOrElse { println("文件读取失败") return } // 2. 预处理：转小写并移除标点 val cleanText = textContent .toLowerCase .replaceAll("[^a-z\\s]", "") // 移除非字母空格字符[^3] // 3. 使用函数组合器进行词频统计 val wordCounts = cleanText.split("\\s+") // 分割单词 .filter(_.nonEmpty) // 过滤空字符串 .groupBy(identity) // 按单词分组 .view.mapValues(_.length) // 计算频次 .toMap // 4. 按词频降序排序 val sortedCounts = wordCounts.toList .sortBy(-_._2) // 负号实现降序 // 5. 输出结果 println(s"总单词数: ${sortedCounts.map(_._2).sum}") sortedCounts.foreach { case (word, count) => println(f"$word%-10s : $count") } } // 读取Word文件工具函数 def readWordFile(path: String): Try[String] = Try { val doc = new XWPFDocument(new FileInputStream(path)) try { doc.getParagraphs.asScala .map(_.getText) .mkString(" ") } finally { doc.close() } } } ``` #### 3. 关键步骤说明 1. **文件读取** 使用Apache POI的`XWPFDocument`读取.docx文件内容[^1]，返回纯文本字符串。 2. **文本预处理** - `toLowerCase()`: 统一小写避免大小写差异 - `replaceAll("[^a-z\\s]", "")`: 移除非字母字符和标点符号[^3] 3. **函数组合器处理流程** ```mermaid graph LR A[split"\\s+"] --> B[filter nonEmpty] B --> C[groupBy identity] C --> D[mapValues length] D --> E[排序输出] ``` 4. **统计与排序** - `groupBy(identity)`: 按单词分组 - `mapValues(_.length)`: 计算每组长度（即频次） - `sortBy(-_._2)`: 按频次降序排列 #### 4. 执行示例输入文件内容： ``` Hello World! This is a test. Word count in SCALA: hello world repeats. ``` 输出结果： ``` 总单词数: 10 hello : 2 world : 2 this : 1 is : 1 a : 1 test : 1 word : 1 count : 1 in : 1 scala : 1 ``` #### 5. 优化建议 1. 对于大文件使用`Iterator`流式处理避免内存溢出： ```scala Source.fromFile(path).getLines() .flatMap(_.split("\\W+")) .filter(_.nonEmpty) ``` 2. 添加词干提取（如Porter Stemmer）提升统计精度 3. 使用`parallel`集合加速大规模数据处理： ```scala cleanText.split("\\s+").par // 转换为并行集合 ``` 此方案结合了Scala函数式编程的简洁性和POI库的文件处理能力，适用于.docx格式的Word文档分析[^1][^3]。