自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

喜欢新技术的彭英峻

不积跬步无以至千里，不积小流无以成江海。

lambda

关注

关注数：文章数：1 文章阅读量：4191 文章收藏量：11

作者: 彭英峻

不积跬步无以至千里，不积小流无以至江海。

展开

使用lambda的parallelStream().forEach处理大的数据的时候，发现会有数据丢失或者下标越界问题

今天再处理kafka日志消息时，按批次每次处理10000条，最后发现每批次处理结果都会比实际数量少一些，最后对代码进行跟踪发现问题，记录下。我们都知道parallelStream使用的时ForkJobTask。而Fork/Join框架是通过把一个大的任务不断的fork成许多子任务，然后多线程执行这些子任务，最后再join这些子任务得到最终结果数据。也就是说，如果你有一个大的数据集要处理，它会将你的数据集切分成若干个小的集合，处理之后再进行聚合，但是我的数据集是ArrayList类型，他的add方法不

原创 2020-07-22 14:57:51 · 4191 阅读 · 0 评论