flink 中计算列和元数据列的使用说明

BigDataMLApplication

已于 2023-08-20 06:59:34 修改

阅读量634

点赞数 1

CC 4.0 BY-SA版权

分类专栏：流数据处理#大数据大数据文章标签： flink 大数据

于 2023-02-13 23:24:25 首次发布

本文链接：https://blog.youkuaiyun.com/wang2leee/article/details/129019076

大数据同时被 2 个专栏收录

50 篇文章

订阅专栏

流数据处理#大数据

8 篇文章

订阅专栏

文章介绍了Flink中计算列和元数据列的概念及区别。计算列基于现有列的表达式求值，用于数据转换和计算；元数据列则是预定义的固定值，如Kafka分区信息，常作为虚拟列添加到结果集。示例展示了如何在Flink中定义元数据列。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 计算列（日期）

计算列是指在数据集中定义的计算列，它可以是简单的常量值，也可以是复杂的表达式，用于从表中提取特定的值。Flink 中的计算列使用 SQL 语句定义，可以在结果集中返回结果。

2. 元数据列（kafka分区）

元数据列是指存储在数据集中的基础列，它们不包含任何计算。它们可以是字符串、数字、日期或其他类型的列。Flink 中的元数据列使用 SQL 语句定义，可以在结果集中返回结果。

以下是一个示例：

CREATE TABLE kafka_table (
  name STRING,
  age INT,
  salary DOUBLE,
  partition_metadata STRING METADATA VIRTUAL
) WITH (
  'connector' = 'kafka',
  'topic' = 'your_topic',
  'properties.bootstrap.servers' = 'your_bootstrap_servers',
  'properties.group.id' = 'your_group_id',
  'scan.startup.mode' = 'earliest-offset',
  'format' = 'json'
)