一、序言
Java8 是一个里程碑式的版本,凭借如下新特性,让人对其赞不绝口。
●Lambda 表达式给代码构建带来了全新的风格和能力;
●Steam API 丰富了集合操作,拓展了集合的能力;
●新日期时间 API 千呼万唤始出来;
随着对 Java8 新特性理解的深入,会被 Lambda 表达式(包含方法引用)、流式运算的美所迷恋,不由惊叹框架设计的美。
二、方法引用
Lambda 表达式是匿名函数,可以理解为一段可以用参数传递的代码(代码像数据一样传递)。Lambda 表达式的使用需要有函数式接口的支持。
方法引用是对特殊 Lambda 表达式的一种简化写法,当 Lambda 体中只调用一个方法,此方法满足函数式接口规范,此时可以使用::方法引用语法。
从语法表现力角度来讲,方法引用 > Lambda表达式 > 匿名内部类,方法引用是高阶版的 Lambda 表达式,语言表达更为简洁,强烈推荐使用。
方法引用表达式无需显示声明被调用方法的参数,根据上下文自动注入。方法引用能够提高 Lambda 表达式语言的优雅性,代码更加简洁。下面以Comparator排序为例讲述如何借助方法引用构建优雅的代码。
(一)方法引用与排序
1、普通数据类型
普通数据类型相对较容易理解。
2、对象数据类型
(1)数据完好
数据完好有两重含义,一是对象本身不为空;二是待比较对象的属性值不为空,以此为前提进行排序操作。
此示例是以Integer类型展开的,同理Double类型、Long类型等数值类型处理方式相同。其中Comparator是排序过程中重要的类。
(2)数据缺失
数据缺失的含义是对象本身为空或者待比较对象属性为空,如果不进行处理,上述排序会出现空指针异常。
最常见的处理方式是通过流式运算中filter方法,过滤掉空指针数据,然后按照上述策略排序。
3、字符串处理
少数开发者在构建实体类时,String类型遍地开花,在需要运算或者排序的场景下,String 的缺陷逐渐暴露出来。下面讲述字符串数值类型排序问题,即不修改数据类型的前提下完成期望的操作。
实体类
正序、逆序排序
数据类型转换排序时,使用 JDK 内置的 API 并不流畅,推荐使用commons-collection4包中的排序工具类。了解更多,请移步查看ComparatorUtils。
小结:通过以排序为例,实现 Comparator 接口、Lambda 表达式、方法引用三种方式相比较,代码可读性逐步提高。
(二)排序器
内置的排序器可以完成大多数场景的排序需求,当排序需求更加精细化时,适时引入第三方框架是比较好的选择。
1、单列排序
单列排序包含正序和逆序。
2、多列排序
多列排序是指当待比较的元素有相等的值时,如何进行下一步排序。
三、Steam API
流的操作包含如下三个部分:创建流、中间流、关闭流,筛选、去重、映射、排序属于流的中间操作,收集属于终止操作。Stream是流操作的基础关键类。
(一)创建流
(1)通过集合创建流
(2)通过数组创建流
应用较多的是通过集合创建流,然后经过中间操作,最后终止回集合。
(二)中间操作
1、筛选(filter)
筛选是指从(集合)流中筛选满足条件的子集,通过 Lambda 表达式生产型接口来实现。
非空过滤
非空过滤包含两层内容:一是当前对象是否为空或者非空;二是当前对象的某属性是否为空或者非空。
筛选非空对象,语法stream.filter(Objects::nonNull)做非空断言。
查看Objects类了解更详细信息。
2、去重(distinct)
去重是指将(集合)流中重复的元素去除,通过 hashcode 和 equals 函数来判断是否是重复元素。去重操作实现了类似于 HashSet 的运算,对于对象元素流去重,需要重写 hashcode 和 equals 方法。
如果流中泛型对象使用 Lombok 插件,使用@Data注解默认重写了 hashcode 和 equals 方法,字段相同并且属性相同,则对象相等。更多内容可查看Lombok 使用手册
3、映射(map)
取出流中元素的某一列,然后配合收集以形成新的集合。
filter和map操作通常结合使用,取出流中某行某列的数据,建议先行后列的方式定位。
4、排序(sorted)
传统的Collectors类中的排序支持 List 实现类中的一部分排序,使用 stream 排序,能够覆盖所有的 List 实现类。
(1)函数式接口排序
基于 Comparator 类中函数式方法,能够更加优雅的实现对象流的排序。
(2)LocalDate 和 LocalDateTime 排序
新日期接口相比就接口,使用体验更加,因此越来越多的被应用,基于日期排序是常见的操作。
正序、逆序排序
5、规约(reduce)
对流中的元素按照一定的策略计算。终止操作的底层逻辑都是由 reduce 实现的。
(三)终止操作
收集(collect)将流中的中间(计算)结果存储到集合中,方便后续进一步使用。为了方便对收集操作的理解,方便读者掌握收集操作,将收集分为普通收集和高级收集。
1、普通收集
(1)收集为List
默认返回的类型为ArrayList,可通过Collectors.toCollection(LinkedList::new)显示指明使用其它数据结构作为返回值容器。
由集合创建流的收集需注意:仅仅修改流字段中的内容,没有返回新类型,如下操作直接修改原始集合,无需处理返回值。
(2)收集为Set
默认返回类型为HashSet,可通过Collectors.toCollection(TreeSet::new)显示指明使用其它数据结构作为返回值容器。
2、高级收集
(1)收集为Map
默认返回类型为HashMap,可通过Collectors.toCollection(LinkedHashMap::new)显示指明使用其它数据结构作为返回值容器。
收集为Map的应用场景更为强大,下面对这个场景进行详细介绍。希望返回结果中能够建立ID与NAME之间的匹配关系,最常见的场景是通过ID批量到数据库查询NAME,返回后再将原数据集中的ID替换成NAME。
ID 到 NAME 映射
准备集合数据,此部分通常是从数据库查询的数据
将集合数据转化成 ID 与 NAME 的 Map
ID与Object类映射
将集合数据转化成 ID 与实体类的 Map
其中Collectors类中的toMap参数是函数式接口参数,能够自定义返回值。
(2)分组收集
流的分组收集操作在内存层次模拟了数据库层面的group by操作,下面演示流的分组操作。Collectors类提供了各种层次的分组操作支撑。
流的分组能力对应数据库中的聚合函数,目前大部分能在数据库中操作的聚合函数,都能在流中找到相应的能力。
映射后再分组
四、Stream 拓展
(一)集合与对象互转
将对象包装成集合的形式和将集合拆解为对象的形式是常见的操作。
1、对象转集合
返回默认类型的集合实例
用户自定义返回的集合实例类型
2、集合转对象
使用默认的排序规则,注意此处不是指自然顺序排序。
上述方法巧妙的解决两个方面的异常问题:一是集合实例引用空指针异常;二是集合下标越界异常。
(二)其它
1、并行计算
基于流式计算中的并行流,能够显著提高大数据下的计算效率,充分利用 CPU 核心数。
2、序列数组
生成指定序列的数组或者集合。
五、其它
(一)新日期时间 API
1、LocalDateTime
日期格式化
2、Duration
3、获取当前时间戳
如下方式获取的是 13 位时间戳,单位是毫秒。
(二)Optional
在Optional类出现之前,null异常几乎折磨着每一位开发者,为了构建健壮的应用程序,不得不使用繁琐的if逻辑判断来回避空指针异常。解锁Optional类,让你编写的应用健壮性更上一层楼。
1、先判断后使用
ifPresent方法提供了先判断是否为空,后进一步使用的能力。
2、链式取值
链式取值是指,层层嵌套对象取值,在上层对象不为空的前提下,才能读取其属性值,然后继续调用,取出最终结果值。有时候只关心链末端的结果状态,即使中间状态为空,直接返回空值。如下提供了一种无 if 判断,代码简介紧凑的实现方式:
六、流的应用
(一)列表转树
传统方式下构建树形列表需要反复递归调用查询数据库,效率偏低。对于一棵结点较多的树,效率更低。这里提供一种只需调用一次数据库,通过流将列表转化为树的解决方式。
Java复制代码
/**
* 列表转树
*
* @param rootList 列表的全部数据集
* @param parentId 第一级目录的父ID
* @return 树形列表
*/
public List<IndustryNode> getChildNode(List<Industry> rootList, String parentId) {
List<IndustryNode> lists = rootList.stream()
.filter(e -> e.getParentId().equals(parentId))
.map(IndustryNode::new).collect(toList());
lists.forEach(e -> e.setChilds(getChildNode(rootList, e.getId())));
return lists;
}