近日,数家大牌充电宝厂商因涉及“过热、燃烧”安全风险,先后宣布召回共计数百万个充电宝。紧接着,民航局规定自6月28日起,禁止乘客携带无3C标识、或召回型号批次的充电宝乘坐境内航班。这场充电宝风波,是由于某家头部电芯供应商旗下代工厂违规替换了电芯生产材料造成的。由于隔膜等电芯生产材料的违规替换,导致生产充电宝的链路不安全了,进而导致了产品问题。
像这种链路,可以抽象为类似于这样的图结构,当原材料“隔膜A”出现问题时,可以通过图迅速定位到大牌A的A批次充电宝存在问题,同一家代工厂同一时期为大牌B生产的B批次充电宝可能有风险,而C批次充电宝则不受影响。
对于这种“链路治理”,许多领域的客户已经在GES上进行了不少业务实践。将相关数据存储在GES上,除了可以进行高效的链路查询外,各领域客户还在用GES做一定程度的链路治理。现阶段,使用GES进行链路治理的客户,主要有下列几种链路类型:
链路类型 | 关联领域 | 主要实践 |
---|---|---|
数据链 | 数据治理领域 | 数据血缘管理、数据溯源与可信 |
供应链 | 物料管理领域 | 物料和供应管理、供应链质量管控 |
业财链 | 政务域、财经域、风控域 | 工单流转分析、异常发票检测、交易风控 |
依存链 | 设备管理域、需求管理域 | 设备影响面分析、热点函数分析、需求E2E追溯 |
数据链
在大模型相关技术被诸多探索应用的今天,模型的可解释性、模型源数据可追溯等需求被提上日程。在一些关键领域,要求大模型的训练数据可以被“追溯”,通过训练数据的可信来保证大模型的可信。GES可以存储模型和训练数据、训练数据和训练数据之间的关系,在某个模型被产品化时,可以对对应训练数据标记,防止训练数据老化、丢失导致的模型不可信。如图,如果模型A的效果比较好,则训练批A、源数据A、源数据B相关数据都应该被保留,保证相关模型训练过程可复现。
在大数据领域,常常有数据血缘需求。数据加工往往涉及数据在多张表、多个系统之间的互相流转,这种流转过程刻画了数据的完整生命周期。图数据库GES可以对这种长链路进行有效组织,通过点边结构将数据加工流程进行完美串联,快速定位异常数据影响的范围,准确圈定最小范围进行数据回溯,降低理解数据和解决问题的成本。
供应链
对于制造业而言,供应链安全是产品安全的重要组成部分。现阶段许多企业,都有自己的供应链质量规范,相应的也有自己的工厂和供应链。当供应链上的数据入图后,在保证链上数据及时准确更新的前提下,当某个零部件产生质量问题或者发生3C认证失效、3C认证过期等场景时,企业可以第一时间得知对应批次的部件已经应用于了哪些产品,进而进行精准召回和备换货等操作,减少企业损失,更好的保护企业的口碑和信誉。
此外,如果能在供应链中输入更上游产品的原材料及变动信息,可以更好的维护供应链安全;如果某个物料类别只有少数几个厂商能提供,通过图算法和查询能更好的识别这些“关键供应商”,避免供应链链路的单一依赖。
在软件研发侧,图数据可以存储和三方件之间的依赖关系,当某个软件包出现依赖超期或者license到期时,可以为对应的产品进行精准预警,提前做好版本升级和替换。
业财链
在政务领域,处理市民投诉时往往涉及多个部门的通力合作。工单在多个部门之间的流转会形成工单的“流转流”,这种流转流也刻画了相关业务的处理。通过挖掘工单的流转过程,可以识别工单流转的低效环节,针对形成了环路的工单,可以分析到底是存在“推诿”、还是确实是需要更高层级处理的疑难问题。
在财税领域,常常要分析财务相关的入账和出账,图也常用于对“财”、“税”、“业”三部分建模。税务系统进行稽查活动时,常关注发票流、货物流、资金流等“多流合一”,这样才能保证“业财一致”。在相关财经系统或者其他风控系统内部,也会利用图数据库重点关注特定的资金流动模式、分析具备相似特性或者链路的发票,进而开展欺诈团伙挖掘或者虚开发票检测等业务场景。
依存链
在SRE领域,将云上设备入图,构建从租户/云服务到主机/机房的全链路关系,当设备发生问题时,可以迅速圈定问题影响面,并通知其他系统;在代码知识管理领域,将代码调用链入图,用于分析热点函数和关键性能瓶颈;在需求管理领域,将需求和设计等信息串联入图,形成需求的管理网络,实现需求质量E2E可追溯。
纵观相关团队已经上图的链路管理业务,发现他们都有几个共同特点:
-
数据来源可靠 入图的所有数据都是真实业务发生的数据,或者从可信的第三方系统上采集的数据,不存在模棱两可的数据。
-
数据更新及时 目前很多业务场景的数据都是实时更新,也有部分场景是每天全量刷新。及时的数据更新,为链上数据的实时性提供了保障。诸如供应链等场景中,只有实时性数据才能支撑相关物料预警和问题研判。
-
治理手段明确
除了依赖GES能力实现多跳秒级查询外,使用什么查询达成什么业务目标,往往在客户心理有明确的答案。例如代码知识管理相关业务需要的就是深度链路搜索,供应链关注的是某个部件对下游物料的影响,发票相关业务关注的是具备相同特征的发票。这样不至于说数据入图后,不知道如何用图实现业务价值。
在图上构造链路的核心在于“透明度”、“准确性”和“时效性”,这样才能保证当链路发现问题时,能及时准确的防范风险实现治理。现如今,图数据库已经是构建链路的必要元素,成为“链路治理”的基础设施,未来图数据库也会越来越多的串联起各式各样的链路数据,释放关联数据的潜在价值。