本文作者:关关
0 内容导读
之前搞过知识图谱产品的培训,感觉相对也是好上手的,所以今天就请小伙伴写了一篇手把手使用教程。
使用软件:GeoScene Pro 4.0(需要有Knowledge授权)
本文在科普知识图谱技术的基本概念与原理同时,将简单介绍GeoScene 知识图谱产品的能力;最后通过模拟的疫情数据,详细讲解如何使用GeoScene Pro构建并可视化与疫情相关的知识图谱,探索实体间的隐藏关系,以便更好地理解和分析数据,提升决策效率和信息整合能力。
1 知识图谱(Knowledge Graph)简述
一、简述
首先,知识图谱到底是什么?
当前,对于知识图谱,学术界和产业界并没有一个被广泛接受的正式定义。当考虑知识图谱的图结构时,知识图谱可以看作是一个图。当它涉及到形式语义时,它可以作为解释和推断事实的知识库。知识可以用事实的三元组形式 - HRT(头实体,关系,尾实体)或者SPO(主语,谓语,宾语)来表达。
举个例子,(阿尔伯特爱因斯坦, 获奖者, 诺贝尔物理学奖)或者(Albert Einstein, WinnerOf, Nobel Prize in Physics)就是一条知识。在这条知识里,有“阿尔伯特爱因斯坦”和“诺贝尔物理学奖”两个实体,“获奖者”是描述这两个实体之间的关系,上述内容在知识图谱中就组成了一个SPO三元组。
图1 示意图
这种图形化知识表示的思想最高可以追溯的1956年Richens提出的语义网(Sematic Net)概念。随着2012年谷歌搜索引擎首次提出知识图谱(Google’s Knowledge Graph)的概念,基于规则的图形化知识表达才逐渐获得了极大的普及。
通常,我们普遍会采用数据表的方式储存信息,例如Excel表格、关系型数据库;但是这种存储方式往往使得数据呈现烟囱式发展,难以形成结构化的知识。知识图谱不仅实现了各类型各专业数据之间的桥接,形成庞大且全面的知识库;同时,还提供了一种新的可视化手段,更直观的展示现实世界的事物之间的关联关系。
二、GeoScene Knowledge 介绍
近两年知识图谱作为前沿技术热点词汇之一被频繁提及。而知识图谱技术如何与GIS结合,如何赋能各行业的业务决策,如何为企业带来增值,如何更好的发挥地理数据价值,是当前业内重点探讨和分析的焦点。
GeoScene 从3.1 版本开始全新推出Knowledge Server知识图谱服务器产品,将知识图谱的能力集成到GIS平台中,提供了即用型的图数据管理、可视化、检索与分析工具。通过连接拥有知识图谱服务器权限的门户,便可在GeoScene Pro (3.1及以上版本)中加载可视化知识图谱、创建知识图谱、查询与分析。分析人员可以通过地图、链接图表、直方图和实体卡片等多种视角将信息可视化,或通过链接网络分析技术(例如:中心性分析、社区分析、最短路径分析等)以及结合空间统计在内的GIS分析技术,挖掘数据中隐藏的关系获取针对数据更全面的认知:
-
预测哪些地理区域可能会因为设施建设而受到最大影响
-
评估额外的人员与设施点的地理位置如何影响整个网络的生产力
-
了解网络中看似无关的两个人在短时间内出现在同一个地方
-
……
图2 GeoScene产品架构图
2 应用教程
一、软件与数据
1.1 操作软件
桌面端GIS软件:GeoScene Pro 4.0
1.2 数据来源
北京市流行病学调查数据集(模拟数据)
注:本数据为编撰模拟数据,为练习使用,非真实数据。
二、创建知识图谱
2.1 用授权账户登录门户
这里我们使用一个现成的“知识图谱培训”资源包,双击以 .aprx 结尾的工程文件,打开工程。(该资源包数据全部为编撰模拟数据,因此就不共享给大家了,本文重点讲操作流程和方法。)
图3 案例包内容
点击头像,用账号密码登录门户。
注意:请确保所使用的门户关联服务器以及账号拥有知识图谱的授权,否则将无法进行后续操作。
图4 登录许可服务器
2.2 创建新调查
在功能区中单机“新建”,查看下拉菜单,点击“新建调查”。
注意:如果没有按照以上要求打开工程文件,可通过点击“视图”栏,找到“目录窗格”选项,打开此界面。
图5 新建调查创建知识图谱项目
在弹出的“创建调查”窗格中:
-
标题:CovidKG_test
-
知识图:选择在门户中创建新的知识图谱项目
-
其他部分可填可不填
-
点击下一步
-
在门户文件夹栏中选择默认(根)文件夹;也可以通过输入名称创建新的文件夹来存储知识图谱服务
-
如有数据库选项,选择默认托管图数据库即可
-
点击下一步