前言
在开发中很多场景下,需要通过读取外部的文件作为输入的数据源进行数据提取,分析和转换,为后续进一步的数据处理做准备,比如读取日志数据等
核心代码
使用flink读取外部数据其实很简单,只需要指定外部数据源的文件路径即可,下面直接贴出代码
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
public class SoureTest2 {
public static void main(String[] args) throws Exception {
//创建执行环境
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
//从环境的集合中获取数据
String path = "E:\\code-self\\flink_study\\src\\main\\resources\\sensor.txt";
DataStreamSource<String> dataStreamSource = env.readTextFile(path);
dataStreamSource.print();
env.execute();
}
本文介绍了在大数据处理中,如何使用Flink读取外部文件作为数据源,以日志数据为例,提供了核心代码示例,并讲解了如何保证数据有序输出。
订阅专栏 解锁全文
9397

被折叠的 条评论
为什么被折叠?



