聚焦基础研究突破,北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML

近日,由北电数智首席科学家窦德景教授牵头,联合复旦大学和美国奥本大学等科研团队共同研发,提出一种DDPA(Dynamic Delayed Poisoning Attack)新型对抗性攻击方法,为机器学习领域的安全研究提供新视角与工具,相关论文已被国际机器学习大会(ICML2025)收录。

ICML由国际机器学习学会(IMLS)主办,聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向,是机器学习与人工智能领域的“三大顶会”之一。ICML 2025年会议于7月13-19日在加拿大温哥华举行,本次会议共接收3260篇论文投稿,最终接受率仅为26.9%,投稿被收录意味着研究成果具备全球领先水平和突出的行业创新性。

北电数智首席科学家窦德景教授在ICML 2025现场展示和介绍研究成果

机器“遗忘”暗藏漏洞,窦德景和合作团队提出新攻击手段

机器学习模型遗忘(Machine Unlearning)旨在降低在已经训练好的模型中移除特定数据点的影响,以增强对隐私法规的合规性。然而,在对抗性学习环境中,基础机器遗忘模型面对恶意遗忘请求时的脆弱性在很大程度上被忽视。

现有的对抗性机器遗忘攻击存在三个关键局限:受限于预定义攻击目标导致的灵活性不足,处理多攻击请求时的效率低下,以及由非凸损失函数引发的不稳定性。如在对抗环境中,机器学习模型在取消学习过程中容易受到恶意取消学习(即数据删除)请求的影响。

窦德景教授和合作团队在论文《Flexible, Efficient, and Stable Adversarial Attacks on Machine Unlearning》中提出DDPA(Dynamic Delayed Poisoning Attack)新攻击方法,旨在克服机器学习模型“遗忘”过程中存在的安全问题。该方法突破现有范式的局限性,无需预先定义攻击目标,能够在遗忘过程中动态调整攻击方向,适应不同的攻击目标。此外,DDPA在处理多个攻击请求时表现出极高效率,无需为每个请求重新构建中毒数据集,大大减少计算成本。同时,通过凸多面体近似技术,DDPA有效解决了非凸损失函数带来的不稳定性问题,确保了攻击的稳定性。

相较现有攻击方法,DDPA方法在灵活性、效率和稳定性上都有较大提升。这将帮助模型开发者更好地发现模型潜在漏洞,推动开发者强化大模型鲁棒性设计,提升模型安全性,更好保障数据安全。

北电数智筑牢AI全栈可信

我国数据资源丰富,产业体系完备,应用场景广阔。在数据安全与服务质量成为核心竞争力的当下,需要产学研用各界协同发力,持续完善可信治理框架,以创新工具为数据“供得出、流得动、用得好、保安全”筑牢基石、架通桥梁。

此次由北电数智首席科学家窦德景教授联合复旦大学和美国奥本大学等团队,以人工智能基础研究为切入点提出DDPA方法,将为从技术层保障数据安全性、铸就AI可信防线构建安全防护。

作为国内最早推出可信数据空间产品的企业之一,北电数智不断深化数据安全能力,以全栈AI可信助力破解数据流通与治理难题,为数字中国建设提供可信高效的数据底座支撑。北电数智已将“红湖·可信数据空间”升级为AI可信数据服务,它以“跨数据写作、数据可用不可见”可信数据空间和数算一体引擎构建底座,内置知识工程、数据合成、动态数据沙箱、模型数据服务等预置工具,并通过加密计算等技术保障全流程确保数据处理的隐私保护。

产研融合聚拢人才,体系赋能AI革新

AI安全是产业健康发展的核心基石,其破局离不开产学研各界的协同探索。

作为北京电控面向人工智能领域的布局产业公司,北电数智坚持聚焦人工智能技术在服务实体经济过程中不断暴露的突出问题和关键瓶颈。以技术创新为锚点持续攻坚,通过深度联合高校、科研院所等机构,汇聚顶尖人才力量,构建起产学研协同创新的强大合力,以体系化赋能模式为产业高质量发展注入不竭动能。

在创新路径上,北电数智坚持“以产业痛点牵引科研,以技术突破反哺产业”,通过吸纳跨学科高端人才,以科技成果转化为目标攻克AI落地关键难题,形成从科研到产业的正向循环,并通过链接超千家生态伙伴,构建“研究-应用-生产”的创新闭环。此次,北电数智联合复旦大学发布的论文入选国际顶会,正是这种“全栈赋能、以用为纲”创新产研体系的生动印证。

以建设数字中国为使命,北电数智秉持长期主义,锚定技术突破与持续创新。北电数智将持续深化可信数据服务与人工智能的双向赋能,夯实从基础研发到产业落地的全栈AI能力,激活产业创新活力,助力AI行业迈向高质量发展新阶段。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

优快云资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值