
在数据要素市场化的浪潮中,可信数据空间是数据要素释放价值的关键支撑。我们观察到,数据安全流通领域的核心实践绝非单一主体的单点突破,无论是政策端的标准制定、学术端的技术突破,还是产业端的落地探索,都需要多方协同打磨。
而这些幕后工作的影响力却渗透在数据流通的每一个环节,从医保与商保的跨域协作,到医疗数据支撑大模型训练,再到金融机构的风控数据共享,可信数据空间正在重塑数据可用不可见的底层逻辑,其发展方向也直接关系到数据要素市场化的推进速度与质量。

当隐私计算从单一技术走向数据流通全栈体系,行业亟需一场深度对谈,厘清可信数据空间的核心命题,它不是一个孤立的技术产品,而是需要标准、技术、制度协同共建的生态系统,它解决的不只是数据不泄露的安全问题,更是数据能流通、价值能转化的产业难题。

这里先为大家插播一则实用信息,由CCF数据治理与发展委员会指导、40余位顶尖专家联合打造的引语数据要素流通技术慕课第三期正在火热进行中,涵盖政策合规到实践案例的八大模块48个课时,能帮大家一站式掌握数据流通核心能力,感兴趣的朋友快快关注起来。隐语·数据要素流通技术MOOC第三期重磅上线!产学研多方联合一站式打造“技能全景图”
作为技术领域的观察者,优快云始终关注那些在数据安全流通领域默默深耕的关键力量,正是他们的探索,在推动行业从概念走向落地,上周,我们邀请到三位行业权威专家:中国信通院云大所副主任袁博、清华大学电子工程系信息系统研究所副所长王钺、蚂蚁密算CEO王磊,从标准、学术、产业三个维度,拆解可信数据空间的核心价值、发展瓶颈与落地路径。三位嘉宾分享的核心观点,恰好回应了行业当下最迫切的疑问,可信数据空间如何定义?标准与技术如何协同?高敏感场景如何落地?成本与安全如何平衡?
不妨跟随我们的视角,一同回溯这场聚焦可信数据安全流通的深度对话。
(根据直播内容提炼整理)
三方视角解析:技术与规则筑牢数据流通信任基石
在数据要素流通的浪潮中,可信数据空间的信任基石绝非单一主体能独立搭建,而是需要政策、学术、产业三方形成合力,方能筑牢安全流通的防护网。本次对话聚焦三方视角,拆解可信数据空间如何以技术为骨、规则为纲,搭建起数据安全流通的信任框架。
董世晓:大家好,今天要聊的核心话题是可信数据空间如何真实保证数据安全流通。数据让生活变方便的同时,如何用得更放心?怎样在保护隐私的前提下,让数据跨部门、跨区域、跨行业发挥最大价值?想请各位老师从各自视角聊聊可信数据空间的定义与核心价值。
袁博:数据空间经过多年发展,其内涵和外延不断丰富。国家数据局相关文件将可信数据空间定义为基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施。可信数据空间以数字合约、使用控制技术为技术核心,通过统一目录标识、统一身份登记、统一接口要求的“三统一”,实现互联互通,并以场景应用为导向,实现数据要素价值高效释放。
王钺:可信数据空间本质是数据管理域的延伸。传统模式下,单一主体内部可通过安全技术构建完备安全管理域,但数据流动需跨越边界,数据提供者难免担心失控。通过可信数据空间,可借助数字合约约定多方数据流动过程,再用使用控制技术确保执行,相当于扩大了数据提供者的安全管理边界,让其能基于共识对跨主体数据流动行使安全管理权能。
王磊:数据管控域延伸的核心是解决供需双方快速建立信任的问题—— 信任是商业化的起点。通过建立信任,数据能真正赋能产业,解决业务痛点,促进产业规模化落地。在可信数据空间的要求中,价值共创是核心,可信管控等都是为了实现价值转化。同时,标准化技术方案能降低企业数据流通门槛和成本,保障合规安全,让数据快速转化为商业价值,赋能实体经济。
董世晓:可信数据空间是能解决业务痛点、可规模化落地的安全数据流通平台,核心价值在于 “能落地、有价值”。它不是单纯的技术或标准,而是能解决企业 “想共享数据怕泄露、想用数据效率低” 的问题,实现安全、效率、商业价值三方共赢。
董世晓:接下来聚焦规则与标准,请袁老师从标准制定者角度,聊聊顶层设计的关键问题。
袁博:目前各类数据空间的产品、概念和认知多样,标准制定的重要性在于形成共识。根据全国数标委相关技术文件,从技术组成角度,可信数据空间以数字合约、使用控制技术为核心,以数据跨主体流通使用的可信(符合预期)为目标。从系统构成的物理角度,可信数据空间主要由可信数据空间服务平台和接入连接器组成。从生态关系的逻辑角度,可信数据空间是在接入连接器及服务平台上形成的数据流通要素和关系的集合。
董世晓:接下来把话题转向治理与实践。王所长,从数据治理角度,可信数据空间不能只让参与方被动合规,还要激发主动性。规则设计中可加入哪些机制,既守住安全底线,又让企业和机构感受到实际收益?
王钺:规则包含法律法规、行业规制、技术标准,侧重点不同:技术标准协调系统互操作,法律法规界定权利边界和责任,行业规制维护市场秩序和公共权益。当前问题是合规成本和监管成本都在上升,常出现 “一管就死、一放就乱” 的情况。传统行为规制管得太细,难以覆盖所有场景,不如转向权利保护 —— 赋予各方主体权利,出现权利冲突时通过协商解决,政府更多扮演仲裁角色,形成多元主体共治。可信数据空间通过数字合约,让主体间能协商交互形态并以技术保障执行。未来需区分政府与市场的规则边界,政府定底线,企业间通过市场化方式协商具体规则。
董世晓:王磊总,在推动可信数据空间方案落地时,遇到的治理相关挑战是什么?
王磊:第一个是 “原始数据不出域” 的定义模糊,“原始数据” 和 “域” 都没有明确界定,很多人把 “域” 理解为物理边界,导致数据流通受阻。好在国家数据局在重新定义 “域”,未来可能是安全域,即数据管控延伸,能解决数据流通融合问题。第二个是个保法中的匿名化要求,数据使用分研发和应用阶段,研发阶段拿不到授权就无法使用数据,导致数据使用链路断裂。蚂蚁正和其他机构、高校推动匿名化国标实施,通过受控匿名化解决风险问题,保障合规。
董世晓:匿名化是否涉及技术挑战呢?参与方主动遵守规则并推动规制,是否需要配套的反馈机制?
王钺:匿名化的绝对要求在技术上难以实现,需要合理调整。当前安全领域的核心问题是风险与收益错配,出问题时责任多落到数源单位,而收益由终端变现方获得。要调动企业主动性,一是要明确责任边界,通过技术手段实现各负其责;二是建立有限责任制度,划定安全责任边界;三是设立安全援助条款和尽职免责制度。但目前这两点都还未实现。责任边界可通过商业化手段界定,但行政体系中的公共数据责任难以转化。尽职免责的核心是 “尽职” 的边界模糊,担心被滥用,目前虽已进入政策视野,但操作层面仍有阻力。这是全球性问题,需要制度、技术、市场协同解决。
王磊:技术上相对成熟,通过受控技术可实现,但如果要求在非受控环境中绝对无法反推出个人信息,技术上难以做到。保险机制在政府侧可行性较低,商业逻辑中数据泄露的定责很难,数据可无限拷贝,溯源困难;还有很多数据泄露未被发现或不敢上报,导致数据安全保险在国内难以推广。
袁博:“原始数据不出域” 的 “域” 更强调的是安全域,可通过隐私计算等技术构建安全可信环境,数据在域内全流程安全可信。匿名化方面,除了企业的受控匿名化实践,相关标委会也在推动国标研制,未来会有更多进展。
董世晓:规则与技术的协同性目前如何呢?
王磊:合规是很大的市场,能推动技术进步,但要把握度。合规要求出台的同时,应明确对应的技术要求,比如 “安全域” 的具体标准、可信数据空间的“可信” 技术指标等。目前很多标准提到了互通的 “三统一”,但未明确 “可信” 的技术细节,供需双方仍不敢放心共享数据。只有细化完善这些技术要求,合规才能真正落地。
董世晓:有没有机制能让协作更同步?
王磊:政策驱动的持续性取决于商业化闭环能否跑通,如果没有规模化商业闭环,政策退坡后可能恢复原样。当前可信数据空间以城市类为主,建完后能否带来实际业务价值、跑通商业闭环,是关键也是难点。
董世晓:技术和规则不同步,怎么找到平衡点,既给技术创新空间,又守住底线呢?
袁博:在安全合规的前提下,当前的重点是急需数据流通利用的场景和应用挖掘,需要以应用为导向,发掘、普及、复制更多典型场景应用。
王磊:技术和合规的冲突是正常现象,社会发展需要不同角色相互制约。解决问题的关键是快速迭代,只有让数据要素和可信数据空间真正运转起来,才能暴露问题、解决问题。数据要素市场化是复杂工程,需要耐心和时间。
王钺:创新和规制不是对立的,行业规制能保护创新。当前的问题是行政干预可能过界,本该市场主体处理的问题,现在由行政干预。需要通过实践找到两者的定位和配合关系,划清行政和市场的边界。
从标准到落地:平衡安全效率与降本路径探索
从标准制定到商业落地,是可信数据空间从理论走向实践的关键环节。这一过程中,需攻克安全与效率的平衡难题,破解成本居高不下的痛点,最终实现数据 “可用不可见,可控可计量” 的目标。
董世晓:隐语社区升级为数据可信流通技术社区,扩展了六大技术线,王磊总,这种升级决策是基于哪些考虑呢?
王磊:升级是一脉相承的,最早做隐私计算就是为了构建信任、促进数据流通。升级的核心考虑有三点:一是技术路线难以达成共识,开源能快速迭代形成共识,补充顶层标准的细节不足;二是技术概念抽象,开源能让抽象概念具象化,便于理解和推广;三是安全的不透明性,开源能让系统暴露在公众监督下,实现安全透明化,降低风险。
董世晓:把可信数据空间想象成 “信任机器”,能不能拆解一下它的运作逻辑,如何实现 “可用不可见,可控可计量”?
王磊:第一是 “全链路的密态保障”,确保数据不泄露,数据放在密态环境中,除密钥持有人外,其他人都无法获取;第二是 “全流程的管控保障”,确保数据不被滥用,通过管控域延伸、合约、密态胶囊等方式,数据流转的每一次使用都受数据源方管控。核心就是解决数据 “不泄露、不滥用” 的问题,这也是 “可用不可见,可控可计量” 的核心实现逻辑。
袁博:可信不是百分百完美安全,而是符合预期、如约执行。可信数据空间的核心能力体现在事前约定承诺、事后如约执行:事前通过共识形成用法用量约定,用数字合约固化;执行过程中通过使用控制确保相关参与方按照数字合约约定的使用策略对数据进行分析、计算和处理等,实现对数据使用的时间、地点、主体、行为和客体等因素的控制,从而保证对数据的使用符合预期。
王钺:信任的核心是符合预期,而非绝对安全。信任缺失往往源于信息不对称,除了技术手段,还可通过制度和管理解决,比如记录过程信息,便于溯源定责,再配套管理制度和奖惩措施,即使技术未达到绝对安全,也能维持信任。
董世晓:这种非绝对安全会不会带来潜在风险?
王磊:数据价值不同,不需要都做到完美安全,用高成本保护低价值数据得不偿失。但数据的特殊性在于拷贝容易,滥用和泄露难以发现、追溯,这是构建信任的最大挑战。所以不同价值的数据要采用不同技术,同时数据可信比其他领域的可信更难实现,需要重点解决可追溯、可感知的问题。
袁博:数据需要全周期管控。事前要审查数据源和主体的可信性;事中通过技术、合约、使用控制等保障可控;事后要可诉可审计,留存合约和交付结果等存证,便于溯源。
董世晓:信任的建立还需要做什么?
王钺:第一是透明化,包括机制、过程甚至代码透明,让用户了解才能信任;第二是多元手段协同,技术上实现透明,制度上通过权威机构认证背书,市场上通过重复交易和案例积累培育信任。
董世晓:王磊总,开源和安全的关系一直有争论,这对平衡安全与效率有何影响?
王磊:开源的优势是透明,大厂不敢埋后门;劣势是实现暴露,可能被黑客攻击。蚂蚁密算选择开源,一是对技术有信心,能防御外部攻击;二是安全价值难以被用户感知,开源能让安全显性化,普及安全心智,避免劣币驱逐良币。安全信任的建立需要漫长时间,一旦出问题就难以重建,开源能提升安全的用户价值认知。
董世晓:蚂蚁密算团队的技术自信的底气来自哪里?
王磊:蚂蚁本身以安全为强项,支付宝的业务属性决定了对安全的高要求。同时我们引入了很多外部专家,和安全领域的院士团队长期合作,做代码安全审计等,在安全上投入大、积累深。
董世晓:蚂蚁密算团队在产品设计中遇到的困难或瓶颈是什么?
王磊:最大的瓶颈是安全性和应用性的平衡。很多业务方把安全看成成本和阻碍,早期接受度低,只有当供需双方难以建立信任、业务无法推进时,才会认可可信数据空间的价值。我们通过对不同等级数据采用不同技术路线,平衡安全能力和业务需求。
董世晓:密态计算作为保障数据全生命周期安全的关键技术,目前处于什么发展阶段?
王磊:还处于相对早期阶段,核心还是心智普及。隐私计算从被认知到被广泛接受,用了多年心智普及期,现在密态计算同样需要长期的接受和普及过程。
王钺:一是当前发展更多靠政府政策驱动,底层共识还不充分,地方建设项目中数据空间定义模糊;二是技术成熟度和用户教育、制度建设不同步,用户习惯和管理制度需要适应性调整,但现在往往是花钱建系统,配套制度跟不上。
董世晓:可信数据空间推广应用的成本如何?有哪些降本路径?请各位从各自角度分享一下。
王磊:成本包括软硬件计算成本、使用习惯转换成本、信任成本,其中信任成本是核心。不同安全需求和等级的数据应采用合适技术,降低整体建设成本。
袁博:降本有三个方向。一是普及共识,让大家认可相关技术方式的可信性;二是根据场景需求和数据类型选择技术方案,平衡成本、性能和安全性;三是发挥数据基础设施的公共属性,建设公共服务平台,降低中小微企业使用门槛。
王钺:还有用户教育成本,可信数据空间和密态计算都是新领域,让用户对问题和解决方案形成共识,需要漫长的教育过程,成本很高。
行业应用前景:跨机构协作释放数据要素价值
可信数据空间的最终价值,需在具体行业场景中落地体现,医疗、金融等领域数据价值高、安全需求强,是跨机构数据协作的典型场景,也是可信数据空间落地的重要突破口。
董世晓:随着可信数据空间从政策探索走向试点落地,行业对规模化的关注度越来越高 —— 毕竟只有真正走进千行百业,才能让数据要素价值落地。最后我们聚焦落地环节:第一,从试点到普及,当前最关键的拦路虎是什么?第二,哪些行业或应用会率先突破,成为落地领头羊?第三,要实现规模化应用,必须解决哪些核心问题?
袁博:从这两年各地试点和行业实践来看,要做好预期管理,形成共识,可信的核心是 “如约执行”—— 事前约定好用法用量,过程中确保不超规,而非绝对无风险。数字化转型基础好、数据驱动需求强的领域,比如金融、通信、交通、医疗等,这些行业本身信息化水平高,数据价值密度也大,当前的应用场景较为丰富。
王钺:我尤其看好医疗健康行业,它的特殊性在于 “数据高价值 + 安全刚需”—— 患者数据、诊疗数据都是敏感信息,但要做疾病研究、药物研发又离不开数据共享,这正是可信数据空间的用武之地,而且医疗行业可以先从科研场景切入,比如新药研发、流行病分析,这类场景有公益普惠属性,监管对合规的要求相对灵活,更容易打开突破口。不过最大的阻碍还是个保法的细节落地,比如科研用数据的授权边界、匿名化处理的标准,这些不明确,医院还是不敢 “放手” 数据。
王磊:医疗是重点发力方向,尤其是医保数据 —— 它既是高价值数据,又连接着医院、患者、商保、药企等多个主体,之前很多医保赋能商保的场景,因为数据交易不规范,要么没法推进,要么有合规风险,而可信数据空间能把这个 “场外交易” 拉到 “场内”,实现增量流通。比如现在有的城市试点 “医保 + 商保” 一站式理赔,就是靠数据空间打通数据链路。除了医疗,金融也是当之无愧的 “领头羊”,因为它的变现路径很成熟 —— 比如公共数据开放后,银行用企业纳税数据做信用贷款风控,保险公司用车主驾驶数据做 UBI 车险定价,这些场景能快速看到商业价值,企业积极性更高。
至于规模化应用的关键,我认为有两个核心。一是场景闭环,不能为了建空间而建空间,必须找到 “数据能解决的真实痛点”,比如医疗的理赔效率、金融的风控精度,有了闭环场景,数据流通才有意义。二是参与方利益分配,这比技术更难 —— 尤其是公共数据领域,不同委办局的数据有不同诉求,有的担心数据安全担责,有的不愿让其他部门 “用自己的数据创造价值”,经济利益、社会价值、政治责任没平衡好,流通就会卡在 “最后一公里”。当然,法律合规的持续迭代也不能少,比如之前提到的匿名化国标,只有标准明确了,企业才敢大胆试。
董世晓:对普通人来说,这些行业的规模化落地,能有什么直观的感受?比如就医、金融服务上,会不会有明显变化?
王磊:在医疗领域比如商保理赔,现在很多人看病后要自己收集发票、病历,提交给保险公司审核,少则一周多则一个月才能到账;但如果可信数据空间打通了医院、医保和保险公司的数据链路,患者在医院用医保支付后,商保部分能实时结算,不用再跑报销流程,这就是 “无感理赔”。再比如带病险,之前保险公司因为拿不到准确的医保数据,不敢给慢性病患者推定制化保险;现在通过数据空间,能在保护隐私的前提下分析患者健康数据,推出针对性的带病险产品,相当于补充了医保覆盖不到的地方,大众的健康保障会更全面。而且医疗行业的社会价值和经济价值能很好地结合,数字化基础也扎实,落地后老百姓能最快感受到好处。
董世晓:从长期看,还有没有更大的发展空间?比如技术和场景结合的新方向?
王磊:长期空间主要集中在保险和医药两大板块。医药领域的潜力尤其大,现在药厂做新药研发,往往需要大量的真实世界数据,比如某种疾病的诊疗方案、患者用药效果,但这些数据分散在不同医院,很难汇总;可信数据空间能把这些数据安全汇聚起来,为药厂提供精准的研发依据,加速新药、新器械的上市进程。比如针对阿尔茨海默病的药物研发,有了多中心的患者数据支撑,就能更快找到病理规律,这对整个医药行业都是利好。
王钺:从技术协同的角度看,可信数据流通还能解决医疗AI 的 “数据瓶颈”。现在医疗垂类大模型发展很快,但公开的医疗数据资源已经快 “耗尽” 了,真正有价值的是医院、体检机构手里的私域数据。通过可信数据空间,能在不泄露隐私的前提下释放这些私域数据,为大模型训练提供 “燃料”, 这样一来,即使是医疗资源不富集的三四线城市、乡镇医院,也能用上训练充分的医疗AI,比如辅助诊断、影像识别,这才是真正的医疗普惠。
王磊:未来甚至能构建 “个人医疗健康数据空间”,把每个人的医保记录、体检报告、诊疗数据、用药史等整合起来,形成全生命周期的健康画像。基于这个画像,不仅能做个性化的健康管理,还能为精准医疗提供支撑。
董世晓:感谢嘉宾的精彩分享,可信数据空间不是单向的技术或规则产品,而是需要多方共建的生态系统。想掌握数据流通核心技能的朋友,也请记得关注隐语开源社区的慕课第三期~
可信数据空间如何保障安全流通
342

被折叠的 条评论
为什么被折叠?



