背景:dataworks提供数据离线批量数据同步。在次离线(批量)的数据通道主要通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(称之为 Reader)、数据写入插件(称之为 Writer),并基于此框架设计一套简化版的中间数据传输格式,从而达到任意结构化、半结构化数据源之间数据传输的目的。
数据集成的基本步骤如下:
步骤一:点击左上角的LOGO,选择 ‘数据集成’ 模块,点击右上角的新增数据源。

步骤二:根据自己的需求选择需要的数据库连接。
----目前可支持的数据源类型有: