随着企业信息化建设的不断推进,数据来源日益多样化,数据量呈爆发式增长。不同业务系统之间的数据孤岛问题逐渐凸显,严重制约了企业对数据的综合分析和利用。人大金仓数据库作为国内领先的数据库管理系统,以其高性能、高可用性和良好的兼容性,在众多企业中得到了广泛应用。然而,如何将分散在不同系统中的数据高效地集成到人大金仓数据库中,并保持数据的实时同步,成为企业亟待解决的问题。下面将演示如何使用ETLCLoud将其他数据库数据集成到人大金仓。
一、数据源准备
在数据源列表中点击新建数据源。

里面提供了大量的数据源模板供大家快速创建数据源,这里选择kingbase模板进行创建

根据配置提示填写相对于的配置,这里创建一个叫人大金仓gs的数据源。

配置完成后点击保存并测试

测试结果提示成功则说明数据源可正常使用

按照同样的方法我们再创建一个MySQL数据源,名字叫本地mysql。

这里我们的数据源就已经配置完成,下面我们来创建数据处理流程。
二、数据处理流程
来到离线数据集成的流程管理,点击新增流程。这里已经提前建好了Kingbase同步的流程,然后打开流程设计。

在流程设计里面,我们从组件列表拉取库表输入,文本文件读取,双流join合并和库表输出组件,通过路由线依次链接。这个流程的作用使使用库表输入读取MySQL的学生成绩表数据,文本文件读取组件来读取文本文件学生班级.csv的文件数据,再用过双流join打宽之后通过库表输出同步到人大金仓数据库中。

文件数据格式

文本文件读取配置:
主要填写文件路径和文件名,第几行读取数据这里,由于我配置输入字段信息,所以不读取文件里面的第一行字段数据,从第二行数据开始读取。其他的配置默认。

文件内容配置:

输入字段配置:
不填写字段则默认将第一行数据作为字段名,第二行开始作为数据,这里为了方便后面双流join配置,所以填写了字段信息。配置完成后点击保存。

库表输入配置:
数据选择刚才创建的本地MySQL,表选择学生成绩表。其他配置默认。

SQL语句:

输入字段:

双流join配置:
选择前面两个节点分别作为ab流。

选择学号字段作为关联条件。

a表字段配置

b表字段配置:

库表输出配置:
数据源选择人大金仓数据源,表选择学生表。其他配置默认。

输出字段配置:

输出选项配置:

运行流程并查看运行结果

流程运行成功

预览数据:使用第三方工具查看数据同步结果

三、总结
ETLCloud作为一种高效的数据集成工具,为人大金仓数据库的集成和数据同步提供了强大的支持。通过合理的ETL设计、数据同步策略和性能优化,企业可以实现数据的高效集成和实时同步,提升数据管理能力,为企业的数字化转型提供有力保障。
1570

被折叠的 条评论
为什么被折叠?



