4、Flink里的UDF函数

Flink UDF与RichFunctions详解

原创

已于 2022-03-11 20:36:46 修改 · 1.3k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#flink #java #大数据

于 2022-03-09 12:24:28 首次发布

本文介绍了Apache Flink中两种重要的用户自定义函数（UDF）类型：函数类和富函数（RichFunctions）。函数类包括MapFunction、FilterFunction等，可以通过匿名内部类或Lambda表达式实现。而富函数如RichMapFunction、RichFilterFunction提供了更多的生命周期方法，如open()、close()，允许访问RuntimeContext并进行初始化和清理工作，实现更复杂的业务需求。通过RichFunctions，开发者可以获取运行环境上下文、并行度等信息，增强函数的功能性。

Flink里的UDF函数

一、函数类（Function Classes）
二、富函数（Rich Functions）

一、函数类（Function Classes）

Flink暴露了所有udf函数的接口(实现方式为接口或者抽象类)。例如使用Map要实现MapFunction，使用Filter要实现FilterFunction,使用Process要实现ProcessFunction等等。
以Filter为例：

	//方式一,自定义外部类实现FilterFunction
    DataStream<String> filterResult = stringDataStream.filter(new MyFilter());
	public static class MyFilter implements FilterFunction<String>{
   
   
	
	    @Override
	    public boolean filter(String s) throws Exception {
   
   
	        return s.contains("flink");
	    }
    }


	//方式二,定义成匿名内部类
    DataStream<String> filterResult = stringDataStream.filter(