Dinky项目快速体验指南：从零开始运行FlinkSQL任务-优快云博客

Dinky项目快速体验指南：从零开始运行FlinkSQL任务

dinky Dinky is an out-of-the-box, one-stop, real-time computing platform dedicated to the construction and practice of Unified Streaming & Batch and Unified Data Lake & Data Warehouse. Based on Apache Flink, Dinky provides the ability to connect many big data frameworks including OLAP and Data Lake. 项目地址: https://gitcode.com/gh_mirrors/di/dinky

前言

Dinky是一个基于Apache Flink的实时计算平台，提供了强大的FlinkSQL开发能力和任务管理功能。本文将带领初学者快速体验Dinky的核心功能，通过实际操作感受Dinky为Flink开发带来的便利。

环境准备

Docker方式启动Dinky

目前Dinky v1.0.0的Docker镜像正在开发中，建议关注后续官方发布。当镜像可用时，可以通过以下命令快速启动：

docker run -p 8888:8888 \
 --name dinky dinky/dinky:1.0.3-flink1.17

重要说明：

默认使用H2内存数据库，适合快速体验但不适合生产环境
生产环境建议配置MySQL或PostgreSQL等外部数据库
启动后访问地址为http://ip:8081

初始凭据：

用户名：dinky
密码：dinky123!@#

第一个FlinkSQL任务实战

创建作业步骤

登录后进入"数据开发"页面
在目录区域右键选择"新建作业"
选择"FlinkSQL"作业类型
填写作业名称并确认

配置作业参数

在右侧配置面板中：

执行模式：选择Local（本地模式）
并行度：设置为1（初学者建议）

编写示例SQL

输入以下FlinkSQL语句创建测试表并查询：

CREATE TABLE Orders (
    order_number BIGINT,
    price        DECIMAL(32,2),
    buyer        ROW<first_name STRING, last_name STRING>,
    order_time   TIMESTAMP(3)
) WITH (
  'connector' = 'datagen',
  'rows-per-second' = '1',
  'number-of-rows' = '50'
);

SELECT order_number,price,first_name,last_name,order_time FROM Orders;

预览功能使用

点击右上角"预览"按钮，系统将：

启动本地Flink集群
执行SQL语句
在"结果"选项卡中展示查询结果

预览功能特点：

仅支持SELECT语句的即时结果查看
适合开发调试阶段验证SQL逻辑
不保留任务状态，关闭即释放资源

完整任务提交流程

编写生产级SQL

修改SQL为包含完整源表和目标表的ETL流程：

-- 创建数据生成源表
CREATE TABLE datagen_source(
  id  BIGINT,
  name STRING
) WITH (
  'connector' = 'datagen'
);

-- 创建数据黑洞接收表
CREATE TABLE blackhole_sink(
   id  BIGINT,
   name STRING
) WITH (
  'connector' = 'blackhole'
);

-- 定义数据处理流程
INSERT INTO blackhole_sink
SELECT id, name FROM datagen_source;