
图 | 图结构 | 图数据 | 图算法
图计算 | 图学习 | 图神经网络
随着图、图结构、图数据、图算法、图计算、图学习、图神经网络等信息技术的快速发展,各行业数字化水平的逐步提高,企业业务环境和计算场景日益复杂,数据间的关联关系也正在变得更加交错。在面对需要深度挖掘数据间复杂关联关系的场景时,传统的关系型数据往往计算效率低下,难以满足应用需求。
本文通过科研端文献研究、产业调研与专家访谈等方式,将从技术、人才、科研与产业四个维度展开分析,阐明行业发展背景、追溯技术发展历程、拆解技术原理及优势、勾勒行业格局,并研判图计算未来发展趋势。

图计算技术特点
一、图计算技术特点
1、高效地对具有复杂关联关系的数据进行深度计算
图提供了一种能够代表现实世界中绝大多数事物关联关系的独特的结构。与经典的表格或者矩阵不同,图上的节点和边并没有被赋予过多的权重,每个元素都依赖于其他元素并形成一种互联互通的关系,而这种关系是所有基于图的假设和预测的核心。在大数据计算中,通过分析图数据之间的关联性,能够高效地从噪声很多的海量数据中抽取有用的信息。
图计算系统基于顶点和边的方式存储图数据和计算,能够建构任意复杂的网络和模型并存储大量的信息,进而完整且形象地映射分析人员想要研究的问题域。经典的表格结构的数据都能够用图数据来表示,但不是所有的图数据都能够用数组或表格的形式来表示。
2、在对简单事物关系的数据进行计算时,列表型的数据尚且能够展现出高效的性能
一旦模型复杂度提升例如金融领域中的交易数据,传统的列表数据模型的劣势将显现无疑。倘若在传统的关系型数据模式下进行分析和计算,复杂的业务场景将带来冗余的表之间的关联操作和频繁的数据通信,造成成千上万倍计算量的提升,系统性能大打折扣,极大降低了计算的效率。但是,在面对高度结构化的数据时,图计算的处理能力将不及基于传统数据模型的计算,这是由于在进行图计算的过程中存在着随机访问的问题。
二、数据库演进方向:关系型数据库向非关系型发展
数据间关联趋于复杂、数据量剧增,对于图数据存储计算的需求随之增长。随着通信技术和大数据的快速发展、业务环境和计算场景趋于多样,企业的数据需求正在发生变化,除了数据量剧增之外,数据之间的关联关系也变得更加复杂交错。虽然传统的关系型数据库已经较为成熟,但在需要进行复杂关联查询的情况下,关系型数据库需要多表关联查询,计算效率低下甚至难以完成。而图数据库的基础数据结构由顶点、边组成,能更自然、准确、直观地表述数据间的关联关系,从而提高计算效果,在社交网络、知识图谱等领域得以大展身手。
三、图数据库发展历程:过往十年关注热度持续攀升
过去 40 年,以 Oracle、 SQL为代表的关系型数据库几乎垄断了全球数据库市场。随着关系型数据库在数据关联分析方面的乏力表现逐渐凸显。在业务场景的驱动下,越来越多的企业对图计算能力的需求快速增长,以增强自身商业决策能力。另一方面,自 2007 年第一款商用图数据库 Neo4j 发布以来,在学术界和产业界的共同努力下,图数据库的可扩展性、易用性等各方面能力逐渐补齐,产品成熟度逐渐提高。目前行业内已有传统数据库、公有云厂商和初创企业等进入。

各类数据库近十年来热度变化
四、图计算系统发展历程:从通用大数据计算系统到专用图计算系统
早期专门针对大型图计算的系统出现之前,业内主要通过单机图算法库或通用大数据计算系统实现。其中,Google 推出的大规模数据并行处理计算模型 MapReduce,以及加利福尼亚大学伯克利分校(UC Berkeley)AMP Lab 开发的 Spark 系统,对图计算系统发展起到了重要推进作用。但由于磁盘存储局限性等问题,通用型大数据计算系统在性能、易用性等方面都未能尽如人意。
图计算领域研究侧追究
一、研究侧追究
1、图计算领域研究侧追踪:近十年 ,热度与发表论文数量双涨
300 年前欧拉开辟了图论研究的范畴,50年前图数据库在计算机诞生之后也随即问世,进入大数据时代,数据量的指数膨胀不仅带来了大量的数据分析需求,使得图计算在面对复杂关联数据时的优势逐渐凸显;同时海量的数据也给予了深度计算发展所需的养分,图计算作为深入挖掘数据信息的有力工具,其研究进入了快速发展期。
从 2003 年到 2021 年,图计算领域论文发表数量呈现明显的上升趋势 ,尤其在 2014、2015年至2021年期间,研究论文发表数量翻倍增长达到高峰。究其本质,移动互联网和金融科技等大数据驱动型行业,以及人工智能相关技术、知识图谱和图神经网络的研究在该时间段内蓬勃发展,极大地拉动了图计算研究热度。另一方面 ,底层硬件的不断升级和图计算引擎的成熟化、公开化也为图计算的研究搭建了完善的基础设施。

图计算相关主题论文发表数量
从上图可以看出,2012 年是研究热度和发表论文数量的阶段性分水岭。近十年,以上述关键词为研究主题的论文发表数量,呈明显增长趋势,相关领域当年论文发表数量均在2020 年、2021 年达到最高峰。
2、图计算领域研究论文地域分布 :中美领衔 ,欧洲国家紧跟其后
根据 Web of Science

本文探讨了图计算技术的发展,包括图数据库、图计算系统、图神经网络等,强调其在处理复杂关联数据时的高效性。图计算在金融风控、社交网络等领域已得到应用,未来趋势包括查询计算一体化、图与机器学习结合及高性能图计算。目前行业仍处于初期阶段,面临市场教育和生态完善等挑战。
最低0.47元/天 解锁文章
32

被折叠的 条评论
为什么被折叠?



