parallelize(在parallelize中,filter和map的执行时一个一个地执行的,见代码执行流程就可以看出)【Java纯代码】

本文介绍了一个使用Apache Spark进行数据处理的示例程序。通过创建一个简单的数据集,并利用Spark提供的API实现数据过滤(filter)与转换(map)操作,展示了如何进行基本的数据处理任务。该示例有助于理解Spark中RDD的基本操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

package com.bjsxt;


import java.util.Arrays;
import java.util.List;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;

public class PipeLineTest {
    public static void main(String[] args) {
        SparkConf conf=new SparkConf().setAppName("test").setMaster("local");
        JavaSparkContext sc=new JavaSparkContext(conf);
        List<String> aslist = Arrays.asList("zhangsan","lisi","wangwu");
        JavaRDD<String> parallelize = sc.parallelize(aslist);
        JavaRDD<String> filter = parallelize.filter(new Function<String, Boolean>() {
            
            @Override
            public Boolean call(String one) throws Exception {
                // TODO Auto-generated method stub
                System.out.println("filter----------"+one);
                return true;
            }
        });
        JavaRDD<String> map = filter.map(new Function<String, String>() {

            @Override
            public String call(String s) throws Exception {
                System.out.println("map*******************"+s);
                return s+"~";
            }
        });
        map.collect();            
    }
}
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值