目录
Scala集合(collection)分为可变集合(mutable collection)和不可变集合(immutable collection)。可变集合可以对其中的元素进行修改、添加、移除;而不可变集合永远不会改变,但是仍然可以模拟添加、移除或更新操作。这些操作都会返回一个新的集合,原集合的内容不发生改变。
一、数组 (Array)
- Scala中的数组分为定长数组和变长数组,定长数组初始化后不可对数组长度进行修改,而变长数组则可以修改。
(一)定长数组
1、数组定义
-
自动推断数组类型
- 手动指定数据类型
(2)定义时指定数组长度,后赋值
-
先定义,后赋值
- 避免数组下标越界错误
2、数组遍历
- 定义数组
arr
(自动推断类型,静态初始化)
- 可以使用for循环对数组进行遍历,输出数组所有的元素
(1)传统for循环方式
-
通过数组下标来遍历数组元素
-
大家可以看到,反向遍历没有输出结果,怎么解决这个问题?
-
参考一下Java正向和反向遍历数组,看能否得到启发
- 通过
arr.length - 1 to 0 by -1
实现反向遍历
-
说明:
num1 to num2 by 1
相当于num1 to num2
(2)增强for循环方式
- 正向遍历数组元素
- 反向遍历数组元素
(3)利用foreach算子遍历数组
- 联想Java里列表的
forEach()
方法结合Lambda
表达式
- 利用Scala的
foreach
算子来遍历数组
课堂练习:数组求和
- 采用遍历算子
- 采用增强for循环
- 课堂练习:采用传统for循环来求和
3、常用方法
- Scala对数组提供了很多常用的方法,使用起来非常方便
- 定义数组
arr
(通过数组类的构造方法来初始化数组,静态初始化)
- 对数组
arr
也可以采用先定义后赋值的方式(动态初始化)
(1)求数组中数值总和
- 调用
sum
方法
-
其实,还可以调用归并算子来求和
(2)求数组中的最大值
- 调用
max
方法
(3)求数组中的最小值
- 调用
min
方法,也可以自己编写代码求最小值
(4)对数组实现升序
- 调用
sorted
方法
- 不可变数组调用
sorted
方法之后会产生一个新的排序数组,而原来的数组保持不变 - 联想一下SQL语句如何实现表记录的排序:
SELECT * FROM t_student WHERE gender = '男' ORDER BY age ASC
(5)对数组实现降序
- 先调用
sorted
方法升序,再调用reverse
方法反序,就可以实现数组降序
- 4,5总结
- 联想一下SQL语句如何实现表记录的排序:
SELECT * FROM t_student WHERE gender = '男' ORDER BY age DESC;
- 试一试,Python列表如何实现升序和降序
- Python列表的
sort()
方法是直接在原列表上进行排序
- Python的内置函数
sorted()
不会改动原列表,会产生一个排序的新列表
课堂练习:数组查询
-
定义一个整型数组,输入一个整数,判断该整数是否在数组里,如果在数组里,给出其位置,否则提示用户该整数不在数组里。
-
在
day03
包里创建Exercise01
对象
package day03 import scala.io.StdIn /** * 功能:列表查询 * 作者:柠檬 * 日期:2023年03月13日 */ object Exercise01 { def main(args: Array[String]): Unit = { val arr = Array(4, 5, 8, 12, 30, 8, 45, 18) for (x <- arr) print(x.toString + " ") println() print("x=") val x = StdIn.readInt() if (arr.contains(x)){ for( i <- 0 until arr.length){ if (x == arr(i)) println("arr(" + i +")=" + x ) } }else{ println(x.toString + "不在数组里~") } } }
- 运行结果
- 用Python语言按同样的思路来编写程序
- 用Java语言按同样的思路来编写程序
-
直接遍历输出等于查询目标的数组元素,统计统计满足条件的个数,如果个数等于零,说明查询目标不在数组里
-
在
day03
包里创建Exercise01_
对象
- 运行程序
-
课堂练习:用多种方法编程将字符串“internationalization”(i18n)中的“a”全部找出来,并给出相应的位置。
(二)变长数组
- ArrayBuffer的API文档:Scala Standard Library 2.13.10 - scala.collection.mutable.ArrayBuffer
1、数组定义
- 变长数组使用类
scala.collection.mutable.ArrayBuffer
进行定义 - 定义一个变长
Int
类型数组arr
,利用+=
运算符、append方法添加一个数组元素(注意是追加元素),还可以利用appendAll方法添加一个数组(多个元素)
2、遍历数组
- 遍历数组
arr
,跟遍历定长数组没有不同
3、移除元素
- 利用
remove
方法可以按下标删除数组元素,当然可能出现下标越界异常
- 利用
-=
运算符按值直接删除数组元素
- 数组中有多个值为
2
的元素,则从前向后删除第一个匹配的元素,本次删除,第一个2
被删除了,但是第二2
还依然存在。 - 下面继续删除
2
(删除完2
之后,继续删除,不会报错,正所谓以不变应万变)
-
使用
remove()
方法还可以在数组的固定位置移除指定数量的元素 -
从数组
arr
的下标为2
的位置开始移除3
个元素
- 如果
移除起始位置 + 删除数量 > 数组长度
,那么就会报错
4、数组合并
- Scala支持使用++=符号将两个变长数组进行合并,其实还可以用appendAll方法来拼接两个数组
- 定义三个变长数组arr1、arr2与arr3,arr1采用++=合并arr2得到result,其实result与合并后的arr1是相等的,然后arr1再利用appendAll方法合并arr3,结果是三个数组的9个元素全部合并进数组arr1里
5、插入元素
-
使用
insert()
方法可以在数组指定位置插入一个元素,做法跟Python王权一样,第一个参数是下标(index),第二个参数是要插入的数据(value) -
在数组
arr1
的下标为2
的位置插入一个元素666
- 注意:一次插入多个元素是要报错的,插入一个数组还是要报错
- 如果插入的位置参数超出数组的长度,要报错
- 这个跟Python不同,插入的位置参数超出数组的长度,就直接在末尾添加新元素
- 如果插入的位置参数等于数组长度,那么就相当于在末尾追加新元素
课堂练习:产生随机整数构成的变长数组
- 产生一个变长数组,包含10个[a, b] (a∈ N \in N∈N, b∈ N \in N∈N, a < \lt< b)之间的随机整数
-
三种方式来产生10个100以内的随机整数构成的变长数组(+=、append、insert)
二、列表 (List)
- Scala中的列表分为可变列表和不可变列表,默认使用的列表为不可变列表。不可变列表也可以增加元素,但实际上生成了一个新列表,原列表不变。列表元素类型可以相同,也可以不一致。
(一)不可变列表
1、创建不可变列表
- 创建列表有静态初始化和动态初始化两种方式
-
创建一个
Int
类型的列表-list1
- 创建一个混合类型的列表 -
list2
,元素类型被系统统一为Any
- 创建一个空列表,后面再添加元素
2、给列表添加元素
- 利用
.+:
在列表头添加新元素 - 在列表
list1
的头部追加一个元素0
,生成一个新列表list3
,列表list1
没有变的
- 利用
::
在列表头添加新元素
(2)在列表尾添加元素
-
利用
.:+
在列表尾添加新元素 -
在列表
list1
的尾部追加一个元素100,生成一个新列表list4
,列表list1
没有变的
- 既然
0 :: list1
是在list1
前面添加新元素,我们自然会猜想list1 :: 100
是在list1
后面添加新元素,验证一下我们的猜想。
- 列表后的
::
运算符要连接一个列表
3、列表合并操作
-
List也支持合并操作
-
创建两个列表
list1
和list2
list1
与list2
合并生成列表list3
,list1
元素在前,list2
元素在后
list1
与list2
合并生成列表list4
,list2
元素在前,list1
元素在后- 用方法调用来实现list1和list2 合并生成 list4
-
结论:冒号
:
靠近哪个列表,那个列表就位于合并列表之前 -
思考题:数组可以用append来追加元素,定长列表可以吗?
4、二维列表
- 列表的列表称为二维列表,其实就是嵌套的列表
- 可以利用二维列表来对应MySQL数据表的多条
- 定义二维列表
students
, 让scala自动推断stuents常量的类型
val students = List(
List(1, "李文丽", 19),
List(2, "肖玉玲", 18),
List(3, "郑刚林", 20))
- 遍历二维列表
students
for (student <- students) {
for (field <- student)
print(field.toString + "\t")
println()
}
- 课堂练习:换种方式遍历二维列表
- 利用scala特殊双重循环和流间变量
- 利用遍历算子
(二)可变列表
- ListBuffer的API文档:Scala Standard Library 2.13.10 - scala.collection.mutable.ListBuffer
1、创建可变列表
- 可变List需要使用
scala.collection.mutable.ListBuffer
类 - 创建列表时初始化数据(静态初始化)
- 先创建空列表,然后利用
+=
运算符添加数据
- 思考题:可用
append
方法给可变列表添加新元素吗?
- 两种方法添加元素
2、列表合并
- 将列表
list1
与列表list2
合并,list1
在前,list2
在后
- 将列表
list1
与列表list2
合并,list2
在前,list1
在后
3、列表排序
- 列表升序和降序(降序 = 升序 + 反序)
4、列表总和、平均值、最值
- 计算总和、最值可以直接调用列表方法完成,平均值得自己计算
5、添加新元素
-
添加新元素有两种方法:在末尾添加新元素用
append
方法;在中间插入新元素用insert
方法 -
调用可变列表的
insert(pos, value)
,在pos
位置插入新元素value
- 特殊情况,在列表头插入新元素,
pos = 0
- 特殊情况,在列表尾追加新元素,
pos = list.length
,此时相当于执行append
方法的效果
6、移除列表元素
- 调用可变列表的
remove(pos, count)
方法,从pos
位置开始移除count
个列表元素 - 任务:移除list列表中的第6、7、8个元素
- 课堂练习
- 创建整型可变空列表,添加1、3、5、7四个元素,在5和7之间插入元素6,移除开头的1、3两个元素,统计列表元素总和、最大值和最小值,最后将列表降序输出。
- 创建整型列表,包含12、5、8、12、9、7、45、16、78、10、3,分别输出奇数列表和偶数列表。(方法一:采用循环嵌套双分支结构;方法二:采用过滤算子来处理)
- 方法一
- 方法二
三、映射 (Map)
- Scala中的Map也分可变Map和不可变Map,默认为不可变Map。
(一)不可变映射
1、创建不可变映射
-
创建不可变映射
mp
,用键->值
的形式
- 创建不可变映射
mp
,用(键, 值)
的形式
- 注意:Map是特质(Scala里的trait,相当于Java里的Interface),不能实例化
2、遍历不可变映射
- 利用for循环来实现遍历
- 调用
mp.keys
的foreach
实现遍历
- 能够按键修改映射的值?
(二)可变映射
- 创建可变Map需要引入类
scala.collection.mutable.Map
,创建方式与上述不可变Map相同。
1、创建可变映射
- 创建可变映射
mp
2、修改可变映射
- 将键
02
的值改为man
(键02
存在,执行修改操作)
- 将键
05
的值改为belle
(键05
存在,执行添加操作)
3、查询可变映射
- 查询键
02
的值,如果没有查到,则返回键02不存在
- 查询键
08
的值,如果没有查到,则返回键08不存在
4、添加元素
-
查看可变映射当前值
- 用两种方式添加元素
- 因为数组和列表都可以用append方法来添加新元素,我们试一试映射可不可以
- 总结
5、删除元素
- 删除存在的键 -
07
对应的元素
- 删除不存在的键 -
11
对应的元素,不报错,映射也没有变化
- 试一试能否用
remove
方法来删除映射的元素
四、元组 (Tuple)
- 元组是一个可以存放不同类型对象的集合,元组中的元素不可以修改。
(一)定义元组
1、直接赋值定义元组
- 定义一个元组
student
2、创建指定长度的元组
- 定义指定长度的元组,其中
Tuple3
是一个元组类,代表元组长度为3
- 目前,Scala支持的元组最大长度为
22
,即可以使用Tuple1
到Tuple22
。元组的实际类型取决于元素数量和元素的类型。
(二)访问元组
- 使用方法_1、_2、_3访问元组的元素,与数组和字符串的位置不同,元组的元素下标从1开始。
- 访问元组的3个元素
- 元组不能像数组或列表那样通过圆括号加下标的方式来访问元素
- 访问元组的第6个元素(不存在的元素),报错
(三)迭代元组
-
直接用for循环遍历元素是不行的
- 使用元组的
productIterator()
方法产生全部元素构成的迭代器,然后遍历迭代器
- 使用for循环遍历元组生成迭代器
(四)元组转为字符串
-
使用Tuple.toString()方法可将元组全部元素组合成一个字符串
-
注意:元组与字符串进行连接运算,元组会自动转换成字符串
课堂练习:对一个字符串进行词频统计
- 创建文件 -
/home/test.txt
方法一
-
读取磁盘文件,然后输出
- 将迭代器的全部行转成列表,然后进行拼接,用空格作为分隔符
- 将字符串按空格进行拆分,得到单词数组
- 对单词数组进行映射操作,得到一个元组(单词, 1)的数组
- 按单词分组,其实是按元组的第一个元素来分组
- 将每个单词的出现次数合并成数组
- 将每个单词的出现次数数组进行归并运算
- 输出词频统计结果
方法二
- 采用了将
groupBy
与mapValues
方法合并的groupMap
方法
方法三
- 采用
groupMapReduce
方法更简单
- 在
day03
包里创建Example01
对象
package day03 import scala.io.Source /** * 功能:词频统计 * 作者:柠檬 * 日期:2023年03月23日 */ object Example01 { def main(args: Array[String]): Unit = { val iterator = Source.fromFile("test.txt") // 获取迭代器 val text = iterator.getLines().toList.mkString(" ") // 降维处理 val words = text.split(" ") // 拆分处理,化整为零 val mp = words.map((_, 1)) // 映射,单词计数 val wc = mp.groupMapReduce(_._1)(_ => 1)(_ + _) // 分组映射归纳 wc.foreach(println) // 遍历输出 } }
- 在ScalaDome.iml下创建文档test.txt
- 运行程序,查看结果
五、集合 (Set)
- Scala Set集合存储的对象不可重复。Set集合分为可变集合和不可变集合,默认情况下,Scala使用的是不可变集合,如果要使用可变集合,就需要引用
scala.collection.mutable.Set
类。 - 集合的三大特点:确定性、互异性、无序性
- 关于Set的API文档:https://www.scala-lang.org/api/current/scala/collection/Set.html
(一)定义集合
- 定义一个空的不可变集合
set1
(Nothing - 一无所有,Scala所有类的子类)
- 定义一个非空的不可变集合
set2
(Any - 包罗万象,Scala所有类的父类)
- 注意:在创建集合时,
4.5
是第二个元素,但是创建完之后的集合里,4.5
成为了最后一个元素,这正好说明了集合的无序性。
(二)增减元素
-
与列表一样,对于不可变集合进行元素的增加和删除实际上会产生一个新集合,原来的集合并没有改变
-
创建一个不可变集合
set
- 添加一个集合不存在的元素 -
100
- 添加一个集合存在的元素
1
,集合里始终只有一个1
(集合具有互异性)
- 当然,
2
和3
两个元素也是加不进去的
- 减去一个存在的元素
2
- 减去一个不存在的元素
666
,没有任何动静
(三)集合方法
- 创建一个集合
cities
1、获取首元素
- 调用
head
方法
2、获取去首子集合
- 调用
tail
方法,去掉了集合里的第一个元素上海
课堂练习:删除排前的三个城市
3、两个集合求并集
- 利用
++
运算符或union
方法求两个集合的并集 - 两个集合都有
6
和2
,但是并集里只出现1
次
4、两个集合求交集
- 利用
.&
或.intersect()
方法求两个集合的交集
5、求集合的最值
- 利用
max
和min
方法求集合最值
6、求集合的总和和平均值
- 利用
sum
方法求和
7、集合的遍历
- 利用for循环遍历集合
六、课后作业
任务:IP地址去重
- 在项目根目录创建
ips.txt
文件
- 创建
Exercise02
对象完成去重工作
package day03 import java.io.FileWriter import scala.io.Source /** * 功能:去重 * 作者:柠檬 * 日期:2023年03月23日 */ object Exercise02 { def main(args: Array[String]): Unit = { val lines = Source.fromFile("ips.txt").getLines() var set = Set[String]() for (line <- lines) set = set + line println("去重后的IP地址:\n") val fw = new FileWriter("distinct_ips.txt") for (x <- set) { println(x) fw.write(x + "/n") } println("\n去重后的IP地址写入[distinct_ips.txt]~") fw.close() } }
- 运行程序,查看结果