目录
问题:
在使用 stream 的 toMap方法时,假设其中存在重复的key,如果不做任何处理,会抛异常:java.lang.IllegalStateException: Duplicate key
复现问题:
构建模拟数据代码如下
// 构建模拟数据
String[] data = new String[]{"a", "b", "c", "d"};
List<HashMap<String, String>> testList = new ArrayList<>();
for(int i = 0; i <= 16; i++){
HashMap<String, String> testMap = new HashMap<>();
int idx = i & (data.length - 1);
testMap.put("id", String.valueOf(i));
testMap.put("value", data[idx]);
testList.add(testMap);
}
得到的模拟数据:
处理数据,使用 toMap方法将 list 转化为 map:
// 对数据进行处理,放入一个map中,key为原map中的"value"值,value为原map中的"id"值
Map<String, String> target = testList.stream()
.collect(Collectors.toMap(
t -> t.get("value"),
t -> t.get("id"))
);
target.forEach((key, value) -> System.out.println(key + ":" + value));
这样直接进行转 map ,当存在重复key时,会抛异常。
问题原因:
toMap方法不会自动处理key冲突问题,参见源码:
这里传入了 throwingMerger 和一个 新的hashmap实例。
throwingMerger 方法什么都没做,只是抛了个异常。
在这里可以看到,处理key冲突的合并策略使用的是 mergeFunction,也就是前面传入的 throwingMerger;mapSupplier 也就是前面传入的 new hashmap,所以其实最终走的是 hashmap 的 merge 方法。
hashmap 的 merge 方法接收一个参数 remappingFunction,当key重复时,也就是old能取到值的时候,使用 remappingFunction 策略来处理冲突,那么就会调用默认传入的 throwingMerger ,也就是抛一个异常。
解决办法
了解了问题的来龙去脉,其实解决也很容易,只需要在使用 toMap 方法的时候,指定一个解决key冲突的策略:
- 只保留一个值:
// 对数据进行处理,放入一个map中,key为原map中的"value"值,value为原map中的"id"值 Map<String, String> target = testList.stream() .collect(Collectors.toMap( t -> t.get("value"), t -> t.get("id"), // 定义 o 为原值,n 为新值, // 策略为保留原值,(o, n) -> 0; // 保留新值,覆盖原值,(o, n) -> n (o, n) -> o) ); target.forEach((key, value) -> System.out.println(key + ":" + value));
保留原值结果:
保留新值结果: - 将所有冲突的value值放入list中:
结果如下:// 对数据进行处理,放入一个map中,key为原map中的"value"值,value为原map中的"id"值 Map<Object, List<String>> target = testList.stream() .collect(Collectors.toMap( t -> t.get("value"), // 将value转化为list,等同于 // t -> new ArrayList<String>(){{add(t.get("id"));}} t -> Lists.newArrayList(t.get("id")), // 指定策略为,合并为一个list (List<String> oldList, List<String> newList) -> { oldList.addAll(newList); return oldList; }) ); target.forEach((key, value) -> System.out.println(key + ":" + value));
总结:
使用 toMap 方法,如果存在重复key,需要指定解决策略。当然也可以使用 groupingBy 方法代替。