Flink初次练习(Source、Sink)

本文是Flink初学者的实践指南,详细介绍了如何创建SourceTest和SinkTest文件。在SourceTest部分,涵盖了从读取本地目录文件、自定义List输出到读取HDFS文件的练习。在SinkTest部分,讲解了如何将数据输出保存为文件。教程中强调了关键操作步骤和注意事项,如异常处理、导入包的选择以及文件路径的准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Flink的官网:https://flink.apache.org/
使用的软件:IntelliJ IDEA Community Edition
CoreAPI:

  • DataSet:专门处理离线数据,给离线数据处理设计了更多有针对性的API. env:ExecutionEnvironment
  • DataStream:一般用于处理流式数据,也可以处理离线数据env:StreamExecutionEnvironment

一、创建SourceTest文件

练习一

读取目录下的文件并打印输出

package cn.tedu.dataset;

import org.apache.flink.api.java.ExecutionEnvironment;
import org.apache.flink.api.java.operators.DataSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

public class SourceTest {
   
    public static void main(String[] args) throws Exception {
   
        //1.获取执行环节
        ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();
        //2.获取数据源
        DataSource<String> source = env.readTextFile("data.txt");
        //3.转化数据
        //4.输出结果
        source.print();
        //5.触发执行程序
        //在datasetAPI中一般不写第五步

    }
}

需要记住的点:

  • throws Exception抛出异常是在第四步鼠标放在print右边使用Alt+回车,选择第一个选项后出现,之前print底下有红色的波浪线
  • public static void main(String[] args)直接写个main再回车就能出现
  • 前两步可以先写等号右边的,再使用Alt+Shift+L,定义名称
练习二

自己定义一个List并打印输出

package cn.tedu.dataset;

import org.apache.flink.api.java.ExecutionEnvironment
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值