多源异构数据_整合多源数据,“DataLink”助力智慧城市!

智慧城市需要数据共融共享,但面临数据存储分散、格式不一、脏数据等问题。DataLink提供可视化工作流,支持多种数据库数据导入与融合,解决数据关联、清洗和监控难题,实现城市资源数据的有效整合与管理。
486a580947dbf3c1c97ae1fdb89b356e.png

点击上方蓝字,关注数据轩

智慧城市不等同于信息化建设和数字化建设。智慧城市最本质的特征在于“大系统”概念,在于集成性、整合性、融合性。

第二届世界互联网大会“互联网之光”博览会上,展示了“新型智慧城市”建设的四个重点。其中第二点城市开放信息平台:以“平台+大数据”为策略,提供城市资源大数据通用服务平台,致力于实现数据共融共享,消除信息孤岛,保障数据安全,提高大数据应用水平。再次强调了数据的共融共享。

数据共融共享面临的痛点

3bf8c4f38af632cdd0d054845e3c2eac.png

不同部门的城市资源数据存储在不同的数据库中,如mysql、oracle、DB2、NoSql、MongoDb、HBase等。

3bf8c4f38af632cdd0d054845e3c2eac.png

城市资源数据的数据关系结构不一致不存在关联关系,如人口数据与企业、建筑、交通、政务等数据;

3bf8c4f38af632cdd0d054845e3c2eac.png

数据体量大,存在部分脏数据或者无用数据,如想要统计高新技术企业工作人员在某个区域中占比的人口比重,那么该区域人员之间的关系就是无用数据。

3bf8c4f38af632cdd0d054845e3c2eac.png

数据迁移的工作量大,无法对迁移过程进行监控,对迁移后的数据质量难以管理。

3bf8c4f38af632cdd0d054845e3c2eac.png

……

c0cd6f09de4360be7be553e90c196200.gif

目前已有的一些数据融合共享工具,存在以下问题:

3bf8c4f38af632cdd0d054845e3c2eac.png

数据集成流程需要大量的代码开发工作,每个流程定制,不能灵活配置。

3bf8c4f38af632cdd0d054845e3c2eac.png

对数据同步流程无法进行可视化监控。

3bf8c4f38af632cdd0d054845e3c2eac.png

数据同步中不支持空间格式数据的迁移,往往将空间导出成文件后,再导入目标系统,操作繁琐。

“DataLink”助力智慧城市

还在为面对上述智慧城市的数据共融共享、消除信息孤岛的问题而苦恼?DataLink以网格化的方式整合多源异构数据,帮助大家解决这些问题。

3a62aa1bb2fc909b27d95017d818277c.png

DataLink怎么解决数据共融共享的痛点

3bf8c4f38af632cdd0d054845e3c2eac.png

支持多种数据库数据的导入与融合,解决数据存储在不同的数据库中的问题。

3bf8c4f38af632cdd0d054845e3c2eac.png

针对多源异构的数据不存在关联关系的痛点,提出对时间和空间维度的多源数据采用统一的时空剖分格网编码方法(时空剖分格网编码的原理与方法会在后续的公众号中详细介绍),对数据进行唯一的编码标识,以元数据的形式存储在所在格网中,为万物互联信息采集标准化提供入口。

a2157d36626fdbf25651dec52f0af177.png3bf8c4f38af632cdd0d054845e3c2eac.png

针对存在无用数据或者脏数据的痛点,采用多种方式对数据进行清洗,如替换null值、列拆分为多行、去除重复值、增加常量、增加序列、字段值设为常量、字符替换等功能。

3bf8c4f38af632cdd0d054845e3c2eac.png

数据迁移的工作量大,无法对迁移过程进行监控,对迁移后的数据质量难以管控的痛点,提出将ETL任务通过可视化工作流展现至B/S架构的系统中的方式,实现了空间数据同步的分布式综合调度管控。

怎么用DataLink做城市资源大数据整合?

导入多源异构的数据

接入人口、企业、经济等城市资源大数据源数据库。通过填写源数据库的链接信息,可以在平台中查询平台内的数据,以及库表结构,无需切换多个工具,即可查看数据操作全流程。

6598c8f3c2e85c8d43ede28f7f8265d3.png069358adb28a35780c95a6a398231590.png

资源数据编码

编码过程

对人口、企业等城市资源大数据中的时空数据进行网格编码。DataLink中提供多种编码方式,选取需要的编码方式,对人口与企业中的地名数据进行地名地址解析后,选择适合的层级,进行网格编码。

ae4d4b02ac5e9a330578767a8db9d720.png8f2ae7159779f1c47572917935588742.png

资源数据集成

依据网格编码进行数据整合。在进行数据整合前,先对城市资源数据中的脏数据进行清理,如:删除企业名为空的数据,清理重复企业数据。

ffc77f4ed4cc840649b3894706981106.png7689ab23e9b7079496b5d4410171217a.gif

然后选择清洗过的时空相关的城市资源数据,依据网格码列进行数据整合。对企业与经济数据等业务数据,根据企业ID进行整合。将整合后的数据输出到目标数据库中。

数据安全与权限

对整合作业进行监控。在以上作业保存后,可以在作业管理中,查看这些作业的运行状态与日志。

4f2c34fa58faec12e3e4db5372ffecec.png73b07d79f89bb7be1ceedf7c1ff04e25.png

数据可视化展示

终于有一份完整的城市资源数据了。

但是,整合后的数据该怎么应用呢?

89a3a09e15f3f20398a0309e3139cb8a.png

这就需要借助其他的工具将数据直观的展现,为应用决策提供支持,由此,我们将整合好的数据接入“洞见”(景轩信息摩尔格网云产品体系的另一款产品)中对整合后的数据进行可视化展示。

311fcf2dfcf2e0ee9306fb36b88d7c32.gif

测试模拟数据整合及可视化结果

注:公司承接的多个项目中数据涉及到隐私权限,不便在此展出,望读者见谅。如有需求,可通过以下方式联系我们,我们期待您的加入!

c8ef02e670dde53af54f1584a39ed5bb.png

格 网 改 变 生 活

电 话:0371-55019103

邮 箱:jx@jx-lab.com

地址:郑州市中原区陇海西路338号升龙金中环B座36层

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值