基于生命周期与风险防范双视角的数据流通安全技术体系

基于生命周期与风险防范双视角的数据流通安全技术体系

陈禹存 1黄科满 2杜小勇 2,3

(1. 中国人民大学统计学院,北京 100086;2. 中国人民大学信息学院,北京 100086;3. 数据工程与知识工程教育部重点实验室,北京 100086 )

DOI:10.11959/j.issn.2096-0271.2024064

引用格式:

陈禹存,黄科满,杜小勇.基于生命周期与风险防范双视角的数据流通安全技术体系[J].大数据,2024,10(06):16-32. 

CHEN  Y C,HUANG K M,DU X Y.A data circulation security technology system based on the dual perspectives of lifecycle and risk prevention[J].BIG DATA RESEARCH,2024,10(06):16-32.

摘 要 随着大数据、云计算和人工智能的快速发展,数据流通安全治理面临新的挑战,亟须形成系统化、可持续增长的技术体系。从技术落地的角度出发,讨论了构建数据流通安全体系存在的问题,梳理了国外典型的数据安全技术体系。在此基础上,提出了数据流通安全治理技术体系框架,从数据流通生命周期和数据流通安全风险应对两个视角,构建了数据流通安全技术体系,包含在数据流通安全中发挥重要作用的49项技术。通过专家评审,从发展阶段、重要程度、技术潜力、落地难度等维度,剖析当前数据流通安全治理技术体系的发展情况和存在的问题。构建和完善数据流通安全技术体系,能够推动数据要素产业和数字经济健康持续发展。

关键词 数据流通安全;技术体系;数据流通;数据风险防范

0 引言

随着大数据、云计算、人工智能等的演进升级,数据的价值愈发凸显,经济社会发生系统性变革,驱动我国加速迈入数字化、网络化、智能化的数字时代。数据要素成为国家发展的重要助推器。国家互联网信息办公室发布的《数字中国发展报告(2022年)》指出,2022年我国大数据产业规模达1.57万亿元,同比增长18%;《国家信息化发展报告(2023年)》指出,2023年我国大数据产业规模达1.74万亿元,同比增长10.45%。党的十九届四中全会提出,健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。这是党中央首次将数据增列为新的生产要素。党的二十大报告多次提及数字领域关键词,提出“加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群”,对建设数字中国提出了更高的要求。而发展数字经济、加快培育发展数据要素市场,必须把保障数据安全放在突出位置。近年来,我国政府高度重视数据安全领域的工作,数据安全已经成为数据要素发展的基石。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确提出:加强涉及国家利益、商业秘密、个人隐私的数据保护,加快推进数据安全、个人信息保护等领域基础性立法,强化数据资源全生命周期安全保护。

数据通过跨空间域、跨管辖域、跨信任域的流通过程,在不同场景中释放更大的价值。数据流通发展态势迅猛,数据流通成为释放数据要素价值的关键方式,但构建高效、安全的数据流通体系仍存在诸多阻碍。

首先,数据在流通中的风险是客观存在的,数据价值越大,风险越大。数据具有易复制、易篡改、多粒度、边际成本低、价值后验性、可替代性等特性,同一数据可被不同主体多次采集、存储,数据被一个主体使用时并不影响其他主体的使用。而数据携带了实体(如人、机构等)的隐私或者机密信息,数据价值越大,其在流通过程中的泄露风险就越大。

然后,数据在流通中的安全标准具有一定的主观性,难以统一。不同国家、地区和行业有不同的安全标准和要求,这些标准和要求可能存在显著差异,甚至冲突。标准不统一可能导致流通成本增加等问题。同时,不同主体对数据安全和隐私的判断具有主观性,在没有统一的隐私安全衡量标准下,数据流通风险具有一定的不确定性。

最后,数据外循环的参与主体多,安全风险范围广,责任边界模糊。数据流通涉及数据的聚合、处理、发布、应用等多个阶段,每个环节的风险均不相同。数据流通的参与主体多,包括数据提供方、数据接收方、第三方服务商以及监管机构等。不同参与主体的责任不同,其对数据安全的监测能力差异较大,一旦发生数据泄露或其他安全事件,难以迅速确定责任方并采取有效的补救措施。

针对以上问题,数据流通安全技术在促进数据的安全可信流通方面可发挥重要作用。数据流通安全技术体系的研究集中在两个方面:一是单一数据主体的数据流通安全风险,例如政务数据安全、行业数据安全、个人数据安全;二是数据安全治理的具体技术,例如数据跨境流动、数据要素市场、基础设施建设、数据要素流通等。目前的研究缺乏对数据流通安全技术体系和具体数据流通安全技术的详细探讨,如数据流通安全技术的定义、边界与发展情况。综上所述,亟须构建一套面向数据流通的安全治理技术体系,聚焦于技术本身,为数据流通提供一套完善的安全技术指导。

本文首先从国外数据治理体系出发,分析与数据流通安全有关的技术,然后介绍基于生命周期与风险防范双视角的数据流通安全技术体系,最后结合专家评审意见,分析该技术体系的现状并进行展望。

1 国外数据安全技术体系

数据流通安全作为数据安全的重要组成部分,其技术体系中的技术应当源于数据安全技术体系。因此,本文从数据安全技术体系出发,研究国外数据安全技术体系中包含的数据安全技术,从中提取有关数据流通安全的技术。

1.1 2023年应用安全技术成熟度曲线

Gartner技术成熟度曲线是Gartner公司提出的分析工具,旨在描述新兴技术从初始概念到广泛应用的成熟过程。《2023年应用安全技术成熟度曲线》从业务效益、成熟度、市场渗透率等维度评价并分析当下备受关注的27种数据安全技术及服务的技术成熟度,将与数据安全有关的技术分为5个阶段,分别是技术萌芽期、期望膨胀期、泡沫破裂低谷期、稳步爬升恢复期、生产成熟期,具体如图1所示。

189502da9e1667d8d4ebadb793ea9483.jpeg

图1   Gartner数据安全技术体系

(1)技术萌芽期

技术刚被提出或实现,市场对其关注度高,少数对商业敏感、富有冒险精神的企业开始尝试。技术处在新兴阶段,尽管存在缺点,但其创新潜力引起了部分企业的兴趣。

(2)期望膨胀期

技术逐步成型,部分企业开始跟进,开发与该技术相关的应用。随着媒体的报道和初期成功案例的增多,技术的关注度逐步达到顶峰,但实际应用和效果往往不如预期。

(3)泡沫破裂低谷期

技术的局限和缺点逐步暴露,由于无法达到预期,市场兴趣和投资热度开始下降,媒体的关注度也显著下降。一些项目失败或被放弃,企业开始质疑技术的实际价值。

(4)稳步爬升恢复期

随着时间推移,技术细节逐渐成熟,优缺点越来越明显,企业开始理解其真正的应用价值。更多的供应商开发出实用的产品,成功进入实践阶段的案例增多,在市场上受到主要媒体与业界的关注。

(5)生产成熟期

经过不断的发展,技术变得稳定和成熟,被广泛应用于各种场景,市场占有率越来越高,进入稳定应用阶段,业界有了一致的评价。

1.2 IDC数据安全技术体系

IDC在2022年发布了《IDC TechScape:中国数据安全技术发展路线图,2022》,对中国数据安全市场进行系统化评估与分析,并对18个重要的数据安全技术进行了细致分析,给出IDC对于不同数据安全技术的定义和对其发展的理解,详细阐述了每个数据安全技术的发展程度、技术优势和劣势。此外,IDC对数据安全技术的市场采纳度进行了可视化展示。IDC数据安全技术体系根据技术的市场影响以及各技术的发展阶段,将技术分为变革型技术、主导型技术以及机会型技术,具体如图2所示。

cf3428e8835e43637b524fee3a7dcc3d.jpeg

图2   IDC数据安全技术体系

(1)变革型技术

变革型技术将重塑市场及技术投资策略,可以创造新的市场机会和用户需求。此类技术通常与现有成熟技术存在较大区别,并且由于出现时间较短,其市场影响尚不明朗。

(2)主导型技术

主导型技术在当前数据安全领域中具有重要地位,处在不断迭代的发展期。

(3)机会型技术

此类技术多为在特定领域发挥作用的技术,其发展局限于具体的应用场景,而在改进数据安全的整体技术和流程方面的作用有限,如硬件安全模块。

2 数据流通安全治理技术体系

数据流通安全是数据安全的重要组成部分。数据流通安全相关技术的发展仍处于起步阶段,目前数据流通仍然存在标准不统一、责任主体不明确、市场制度不健全等问题,而国内外数据安全技术体系各有侧重,因此,构建一个全面、系统的数据流通安全技术体系尤为重要。本文围绕构建数据流通安全治理框架的目标,首先从数据流通生命周期出发,分析数据在不同流通阶段的具体情况,然后探讨数据在不同流通阶段中可能遇到的数据流通安全风险,最后基于数据要素流通价值生态模型,从数据流通生命周期与数据流通风险两个视角,梳理数据要素在流通的各个阶段所需的技术,从而构建数据流通安全技术体系。

2.1 数据流通安全治理技术体系框架

基于数据流通生命周期和数据流通安全风险应对视角,构建如表1所示的技术体系矩阵框架。

表1   数据流通安全技术体系矩阵框架

1cac5068ac5309f0a191cbcda444782c.jpeg

表1的每一列代表数据流通的不同环节,每一行代表应对数据流通安全风险的不同阶段,矩阵中的元素代表了在某个数据流通环节中以及某个风险应对阶段中应具备的技术能力。例如,在数据组织汇聚活动中,事前预防阶段应具备的技术能力包括通过分级分类管控风险,事中应对阶段应具备的技术能力包括跟踪数据组织汇聚过程中可能导致分级分类变化的过程,事后补救阶段应具备的技术能力包括当数据组织汇聚导致安全级别变化时,动态调整安全分类分级,并动态更新。

2.1.1 数据流通生命周期视角

从数据价值释放的角度出发,在跨域数据治理的框架中,数据管理需要经历3个关键阶段:数据组织汇聚、数据发布和数据流通应用。数据组织汇聚强调各个主体将组织内外部数据进行有效整合、汇聚到统一的数据底座中,并进行清洗、加工等一系列处理,通过数据标签化、对象化的组织方法,形成动态、可共享、可复用的数据资源,以供外部的应用和服务使用。数据发布强调将数据资源转化为可供其他应用程序、系统或用户使用的服务,对外发布,从而支撑数据资源的开放、共享和交易,以满足跨域业务协同的需求。数据可信流通更注重数据资源在不同主体之间的共享流通和开发利用,通过融合不同主体发布的数据服务,满足多方主体跨域业务的动态协同和跟踪审计。

(1)数据组织汇聚

在跨域数据治理的场景下,数据组织汇聚是数据资源全生命周期管理在跨域场景下的延伸,其主要目的是打破企业或组织中的数据孤岛状态,集成和整合组织内外部的数据资源,并通过搭建统一的数据底座,进行原始数据的清洗、加工、组织和加密等数据资源化生产过程。在此基础上,采用数据分级分类、数据加密等组织方法,对数据资源的全生命周期进行管理,以形成动态、可共享、可复用的数据资源。

数据组织汇聚是数据流通安全保障的基础环节。有效的组织和管理能够实现更高效的流通和共享,确保数据在全生命周期内安全、可控,为企业或组织的数字化转型发展和业务创新提供强有力的支持。

(2)数据发布

经过数据的组织汇聚,杂乱、无序、错误的原始数据被转化为有价值的、有组织的数据资源。数据资源应用到具体场景中,流通起来,才能更充分地释放数据的价值。然而,考虑到数据资源的质量、安全、隐私、权属等多方面因素,数据不能直接在各个主体之间进行共享、流通。数据发布是指将数据资源打包封装为可访问和可重复使用的数据服务或产品并对外提供的过程。在这个过程中,需要进行数据脱敏、密钥管理、访问控制等以保障数据发布过程的安全性与精准性,确保数据不会被泄露、被滥用等。

(3)数据流通应用

数据流通应用属于跨域数据治理的价值释放部分,旨在保障数据生产要素在不同主体之间被共享流通和开发利用,实现可信可靠的数据价值释放。在这个阶段,数据流通应用安全技术主要针对数据确权、数据安全应用监管、数据融合、数据溯源等方面的问题,保障数据在跨域流通环节中被安全应用,主要包括数据处理溯源、安全态势管理、数据访问控制等技术。

2.1.2 数据流通安全风险视角

在数据流通全生命周期中,安全风险是客观存在的。确定技术体系框架中数据流通不同阶段的应对措施,有助于降低数据流通中的安全风险。数据流通中的风险应对包括3个阶段:事前预防、事中应对和事后补救。其中,事前预防强调在数据流通之前,识别并评估潜在的安全风险,并采取相应的防范措施;事中应对侧重于在数据流通过程中监控和应对安全事件,确保数据流通的安全和连续性;事后补救注重在安全事件发生后进行补救和恢复,减少损失并防止类似事件再次发生。

(1)事前预防

在跨域数据治理的场景下,事前预防是数据安全管理的第一道防线,其主要目的是在数据流通之前,识别和评估数据流通中潜在的安全风险,并采取相应的防范措施。这一阶段的重点是建立系统的风险管理机制,通过全面的风险评估和分析,确定风险的类型和等级,并制定相应的应对策略。

(2)事中应对

在数据流通过程中,事中应对是确保数据流通安全和连续性的关键环节。安全风险的事前预防无法完全保证数据流通过程中的安全,一旦遭受恶意攻击或者发生数据泄露、数据丢失等安全问题,事中应对技术能够及时发现和应对安全事件,防止影响范围继续扩大,确保数据流通的安全和连续性。

(3)事后补救

在安全事件发生后,事后补救是减少损失并防止类似事件再次发生的重要环节。这一阶段的重点是对安全事件进行详细分析和总结,明确事件发生的原因和影响范围,并进行数据恢复和修复,改进和优化现有的安全策略和措施。

2.2 数据流通安全技术体系

基于数据流通生命周期视角和数据流通安全风险应对视角,本文综合了上述的两个典型的国外数据安全技术体系以及国内代表性企业的数据流通安全治理体系,提取每个技术体系中有关数据流通安全的典型技术,形成了与数据流通安全治理相关的49项核心技术,并从技术落地的角度,对每项技术的定义、边界和应用场景做了界定。此外,根据每一项技术在数据流通安全领域的实际应用情况,将其划分为不同的发展阶段。数据流通安全技术体系见表2。其中,新兴技术代表这项技术处于诞生和研发阶段,具有较高的市场与外界关注度;快速发展代表这项技术已经初步具备实际应用的可能性,市场上有成功的案例可供参考;稳步发展代表这项技术的细节逐渐成熟,已经形成了一定规模的应用;技术成熟代表这项技术被各方广泛应用,有一定规模的市场;发展瓶颈代表这项技术因技术研发遇到困难或者市场需求降低而发展速度缓慢,处在瓶颈阶段。

表2   数据流通安全技术体系

61a6c61fb7940d85e913cc2d93432825.jpeg

3f89b1ff5649cc85482dd892404b7e8d.jpeg

fad926beada7430461bbd9d01d1a1647.jpeg

为了从数据流通价值和风险应对两个维度理解这些关键技术,探讨当前数据流通安全技术体系的发展,我们邀请了28名领域专家,对这49项技术所处的数据流通阶段和数据流通安全风险应对阶段进行分类,其中24位专家完成了所有数据的填写。具体而言,针对每个技术,每位专家独立选择该技术所处的数据流通生命周期阶段以及其能够在数据流通安全风险的哪个应对阶段发挥作用。在此基础上,形成如表3所示的数据流通安全治理技术体系矩阵。

表3   数据流通安全治理技术体系矩阵

cc0559fe26a2a104542b38a645548b5c.jpeg

3 技术体系发展情况分析

为了探究数据流通安全技术的实际落地与应用情况,我们邀请每一位专家从重要性、落地困难程度以及技术潜力3个角度对每项技术进行打分。每一位专家评分时,需要在这49项技术中选择10项最重要、落地最困难、最有潜力的技术。数据流通安全治理技术体系中技术的得分见表4,每项技术的得分代表有多少位专家选择了该项技术,得分越高代表专家认为该项技术越重要,或者落地难度越大,或者潜力越大。

表4   数据流通安全治理技术体系中技术的得分

ad074fa043e3816d611d9ee76327723a.jpeg

83168041cd10f25b75e33fc152190ab5.jpeg

3.1 技术的受重视程度与其发展阶段的相关性强

由表4可知,技术的受重视程度与其发展阶段展现出了较强的相关性。除了数据脱敏技术,大部分发展瓶颈阶段和成熟阶段的技术的重要程度得分和技术潜力得分非常低。而在最重要和最有潜力的技术中,新兴技术和快速发展的技术的比例最高,未来其将是数据流通安全技术治理体系的重要组成部分。同时,在重要程度得分和技术潜力排名前十的技术中,有8项技术相同,分别是:数据分类分级、安全多方计算、生成式网络安全AI、联邦学习、合成数据、数据处理溯源、数据价值评估、区块链(数据安全相关)。由此可见,技术的重要程度与其发展潜力密切相关。

生成式网络安全AI涵盖了数据流通价值活动的3个环节,数据分级分类和数据价值评估则着眼于数据组织汇聚阶段,合成数据为数据发布阶段提供了新思路。而数据安全基础设施管理平台、策略即代码等新兴技术,成为丰富数据流通安全风险应对策略的技术方向。

3.2 新兴技术和快速发展技术潜力巨大

数据流通安全技术中最有潜力的10项技术分别为生成式网络安全AI、合成数据、联邦学习、安全多方计算、数据处理溯源、区块链(数据安全相关)、数据价值评估、数据分类分级、数据安全基础设施管理平台、代码安全助理。这10项技术主要集中在数据发布与风险事前防范两个环节中。从数据流通生命周期视角来看,10项技术中有7项位于数据发布环节,3项位于数据组织汇聚环节,1项位于数据流通应用环节;从数据流通安全风险应对视角来看,10项技术中有8项位于事前预防环节,2项分别位于事中应对环节与事后补救环节。由此可见,除了数据发布阶段的技术,处于数据组织汇聚环节的技术逐渐被关注;风险应对策略正在往事中应对和事后补救环节发展。

从发展阶段来看,10项最有潜力的技术中,5项技术处于快速发展阶段,4项技术是新兴技术,合成数据是唯一处于稳步发展阶段的技术。由此可见,这些新兴技术以及处于快速发展的技术往往具有较大的技术潜力。

3.3 技术体系中技术分布不均衡

目前的技术体系中存在技术分布不均衡的问题,具体情况见表5和表6。从数据流通的视角来看,49项技术中,属于数据组织汇聚环节的技术仅有11项,而属于数据发布和数据流通应用环节的技术分别有35项和21项。从数据风险应对的视角来看,属于事后补救环节的技术仅有2项,而属于事前预防环节和事中应对的技术分别有39项和19项。数据组织汇聚环节和数据流通风险事后补救的技术较为缺乏。此外,在数据全生命周期流通中,数据销毁也是一个重要的过程,能否将数据销毁过程有关的技术纳入数据流通安全技术体系有待研究。

表5   数据流通生命周期视角下技术分布情况

7dc264b2df532d0f426aaa4122e3bef4.jpeg

表6   数据安全风险应对视角下技术分布情况

fd50047ea88aa4f6285e80482d859813.jpeg

3.4 多项重要技术落地困难

多项在重要程度排名中靠前的技术,往往在落地难度方面的排名也靠前,如安全多方计算和机密计算,分别有10名和9名专家认为其很重要,其重要程度排名分别是第3和第6,落地难度排名分别是第1和第5。在数据流通安全技术体系建设中,许多先进技术已被提出,但在实际应用中仍面临以下困难。

(1)技术复杂性

许多先进的加密技术、数据访问控制机制和安全协议的理论被广泛研究,但由于技术复杂度高、部署难度大,在实际操作中难以部署和维护。

(2)成本高昂

高效的数据安全解决方案以及重要技术的发展,往往需要大量的硬件和软件投入以及专业人员的支持。成本高昂的问题在很大程度上限制了数据主体以及数据流通技术的发展。

(3)适配性不足

先进技术的实际应用场景不足,并且在不同应用场景中不同技术的适配性也不相同,难以满足各行业特定的数据流通安全需求。

4 结束语

本文在分析国外数据安全技术体系的基础上,从数据流通生命周期和数据流通风险应对两个角度出发,提出了覆盖数据流通各环节的数据流通安全技术体系框架,通过对数据流通安全领域中49项重要技术的评估,构建了双视角数据流通安全技术体系。目前,数据流通安全技术体系中的技术在实际落地中仍面临诸多挑战,迫切需要在强化数据组织汇聚阶段以及风险事后补救策略两个维度发力。未来的研究和实践应重点关注技术创新与应用落地,注重全链条技术体系构建,增强数据流通安全技术体系的完整性。

数据流通安全技术体系是数据流通的重要保障,也是数据流通安全治理框架不可或缺的一环。构建和完善数据流通安全技术体系,为激活数据要素潜能和释放数据要素价值提供保障,推动数据要素产业和数字经济的健康可持续发展。

作者简介

陈禹存,男,中国人民大学统计学院硕士生,主要研究方向为多模态、自然语言处理。

黄科满,男,博士,中国人民大学信息学院副教授,中国人民大学吴玉章青年学者,麻省理工斯隆管理学院网络安全研究中心兼职研究员,国际网络安全专家CISSP认证。主要研究方向为数字生态、数据治理、网络安全治理。

杜小勇,男,博士,中国人民大学吴玉章讲席教授、明理学院院长,数据工程与知识工程教育部重点实验室主任,中国计算机学会会士,国家数据标准委员会首批委员,国家信息技术标准委员会委员。主要研究方向为数据库与大数据技术、数据治理。

联系我们:

Tel:010-53879208

       010-53859533

E-mail:bdr@bjxintong.com.cn 

http://www.j-bigdataresearch.com.cn/

转载、合作:010-53878078

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

23d2b285254a46dbe38cbcccc35015a7.jpeg

关注《大数据》期刊微信公众号,获取更多内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值