Scala集合库:并行集合、设计惯用法与类型特化
1. 并行集合概述
并行集合的核心思想是利用现代多核系统提供的并行硬件线程。原则上,任何可以并行执行的集合操作都能利用这种并行性。具体做法是将集合分割成多个部分,对这些部分应用组合操作(如 map ),然后将结果合并以得到最终结果,这是一种分治策略。
然而在实际应用中,并行集合并未得到广泛使用。原因在于并行化的开销在很多情况下会超过其带来的优势,而且并非所有操作都能并行化。这些开销包括线程调度、将数据分割成块以及后续合并结果等任务。通常,除非集合规模很大,否则串行执行会更快。因此,在实际环境中,需要对具体场景进行性能分析,以确定目标集合是否足够大,以及并行操作是否足够快,从而决定是否使用并行集合。
1.1 创建并行集合
创建具体的并行集合有两种方式:
- 直接使用与非并行集合相同的方式构造实例。
- 对相应的非并行集合调用 par 方法。
并行集合的组织方式与非并行集合类似,在 scala.collection.parallel 包中定义了通用的特质和类,其中不可变的具体集合位于 parallel.immutable 子包,可变的具体集合位于 parallel.mutable 子包。
1.2 并行操作的顺序问题
需要注意的是,并行化意味着嵌套操作的顺序是不确定的。以下是一个将 1 到 10 的数字组合成字符串的示例:
超级会员免费看
订阅专栏 解锁全文
1611

被折叠的 条评论
为什么被折叠?



