filter 起到过滤的作用
直接上代码
ArrayList<Integer> list = new ArrayList<Integer>();
list.add(1);
list.add(2);
list.add(3);
list.add(4);
list.add(3);
JavaRDD<Integer> parallelize = sc.parallelize(list);
JavaRDD<Integer> filter = parallelize.filter(new Function<Integer, Boolean>() {
@Override
public Boolean call(Integer integer) throws Exception {
if (integer == 4) { // 过滤掉等于4的
return false;
}
return true;
}
});
List<Integer> collect = filter.collect();
for (Integer integer: collect){
System.out.println(integer);
}
本文介绍了Apache Spark中Java API的filter算子用法,通过实例代码展示了如何过滤数据,帮助理解Spark数据处理的核心功能。
5768

被折叠的 条评论
为什么被折叠?



