Flink基础（六）：常用算子详解

最新推荐文章于 2025-02-01 15:58:40 发布

Hello Guava

最新推荐文章于 2025-02-01 15:58:40 发布

阅读量3.4k

点赞数 4

分类专栏： Flink学习之路文章标签： flink

本文链接：https://blog.youkuaiyun.com/weixin_42155491/article/details/104881844

版权

本文将给大家介绍的就是 Flink 中的批和流程序常用的算子

DataStream Operator

我们先来看看流程序中常用的算子。

Map

Map 算子的输入流是 DataStream，经过 Map 算子后返回的数据格式是 SingleOutputStreamOperator 类型，获取一个元素并生成一个元素，举个例子：

SingleOutputStreamOperator<Employee> map = employeeStream.map(new MapFunction<Employee, Employee>() {
    @Override
    public Employee map(Employee employee) throws Exception {
        employee.salary = employee.salary + 5000;
        return employee;
    }
});
map.print();

每个Employee对象的salary 值加5000后出来

FlatMap

FlatMap 算子的输入流是 DataStream，经过 FlatMap 算子后返回的数据格式是 SingleOutputStreamOperator 类型，获取一个元素并生成零个、一个或多个元素，举个例子：

SingleOutputStreamOperator<Employee> flatMap = employeeStream.flatMap(new FlatMapFunction<Employee, Employee>() {
    @Override
    public void flatMap(Employee employee, Collector<Employee> out) throws Exception {
        if (employee.salary >= 40000) {
            out.collect(employee);
        }
    }
});
flatMap.print();

每个Employee对象的salary 值大于40000的出来

Filter

对每个元素都进行判断，返回为 true 的元素，如果为 false 则丢弃数据，上面的代码也可以用filter来做：

SingleOutputStreamOperator<Employee> filter = employeeStream.filter(new FilterFunction<Employee>() {
    @Override
    public boolean filter(Employee employee) throws Exception {
        if (employ

最低0.47元/天解锁文章