一、Table API和SQL的基本使用
想使用Table API和SQL,首先要创建一个TableEnvironment。TableEnvironment对象是Table API和SQL集成的核心,通过TableEnvironment可以实现以下功能。
•通过内部目录创建表。
•通过外部目录创建表。
•执行SQL查询。
•注册一个用户自定义的Function。
•把DataStream或者DataSet转换成Table。
•持有ExecutionEnvironment或者StreamExecutionEnvironment的引用。一个查询中只能绑定一个指定的TableEnvironment,TableEnvironment可以通过Table Environment.getTableEnvironment()或者TableConfig来生成。TableConfig可以用来配置TableEnvironment或者自定义查询优化。如何创建一个TableEnvironment对象?具体实现代码如下。Java代码实现如下。[插图]Scala代码实现如下。[插图]通过获取到的TableEnvironment对象可以创建Table对象,有两种类型的Table对象:输入Table(Input Table)和输出Table(Output Table)。输入Table可以给Table API和SQL提供查询数据,输出Table可以把Table API和SQL的查询结果发送到外部存储介质中。输入Table可以通过多种数据源注册。
•已存在的Table对象:通常是Table API和SQL的查询结果。
•TableSource:通
本文介绍了Flink的Table API和SQL的基本使用,包括如何创建TableEnvironment、注册TableSource和TableSink,以及Table与DataStream、DataSet之间的转换。Table API和SQL可以互相融合,允许在查询中无缝切换。此外,还详细讲解了如何将DataStream和DataSet注册为Table以及将Table转换回DataStream和DataSet的不同方式和模式。
订阅专栏 解锁全文
933

被折叠的 条评论
为什么被折叠?



