AI 黑进斯坦福网络 16 小时:它已经开始胜过人类黑客了

如果让 AI 自己去“黑”一所大学的网络,它能做到什么程度?

在一项最新研究中,一个 AI 智能体连续运行 16 小时,成功挖出了斯坦福大学计算机科学网络中的多个安全漏洞,表现甚至超过了大多数职业渗透测试人员。

更关键的是:
它的成本,只是人类专家的一小部分。

一次真实世界的对抗实验

这项研究由斯坦福大学的三位研究人员主导,他们开发了一个名为 ARTEMIS 的 AI 安全智能体,用来测试 AI 是否能在真实、复杂的网络环境中独立完成渗透测试任务。

研究团队给 ARTEMIS 开放了斯坦福大学计算机科学相关的网络环境——

这是一张包含 约 8000 台设备的真实网络,其中包括服务器、计算机和各类智能设备。

与此同时,研究人员邀请了 10 名职业网络安全专家参与同一实验,要求他们至少投入 10 个小时进行漏洞挖掘。


ARTEMIS 则连续运行了 16 小时,其中前 10 小时的表现被用来与人类专家进行直接对比。

结果令人震惊。

AI 的成绩,超过了大多数人类专家

在前 10 小时内:

  • ARTEMIS 发现了 9 个有效漏洞
  • 有效提交率高达 82%
  • 表现超过 10 位人类参与者中的 9 位
  • 与最顶尖的那一位专家表现接近

研究人员指出,ARTEMIS 不仅发现了人类已经注意到的问题,还挖出了一些被人类完全忽略的漏洞。

其中一个漏洞存在于一台老旧服务器上,由于浏览器兼容性问题,人类测试人员甚至无法正常访问该系统页面。而 ARTEMIS 直接绕过图形界面限制,通过命令行请求成功突破。

它为什么能赢?关键不在“聪明”

ARTEMIS 的优势,并不来自“灵感”或“直觉”。

而在于工作方式的彻底不同。

当人类安全专家进行渗透测试时,通常是:

  • 一次关注一个目标
  • 顺序排查
  • 在多个系统之间手动切换

而 ARTEMIS 的方式是:

  • 一旦扫描中发现“可疑信号”
  • 立刻启动多个“子智能体”
  • 并行调查多个潜在漏洞

它不是比人类更聪明,而是更不知疲倦、更擅长并行。

研究人员表示,这种并行探索能力,让AI在复杂网络中展现出人类难以匹敌的效率优势。

还有一个现实因素:成本

ARTEMIS 的运行成本大约是每小时 18 美元;即便是更高级的版本,也只需要 每小时 59 美元。

而一名“专业渗透测试人员”的年薪,通常在 12.5 万美元以上,这意味着:

在成本与效率同时被量化之后

AI 正在成为一种极具吸引力的进攻型安全工具

当然,AI 也并非无懈可击

研究人员同样强调了 ARTEMIS 的局限性:

  • 不擅长图形界面操作
  • 容易遗漏需要复杂点击流程的漏洞
  • 更容易出现误报,把正常的网络响应当成“成功入侵”

正因为如此,它在实验中也错过了一个人类专家成功发现的关键漏洞。

换句话说,AI 并不完美,但已经“足够危险”。

真正值得警惕的,并不只是这项研究

ARTEMIS 的意义,不止在于一次实验排名。它揭示的是一个更广泛、也更现实的趋势:AI 正在显著降低网络攻击的门槛。

过去一年中,多份安全报告已经显示:朝鲜黑客组织使用生成式 AI 伪造身份、制作钓鱼材料;国家级威胁行为体借助 AI 执行大规模网络攻击;AI 被用于数据窃取、系统瘫痪、网站操控等场景

攻击正在变得更快、更便宜、更规模化。

当进攻被自动化,人类该站在哪?

这项研究并不意味着 AI 会“取代”网络安全专家。

相反,它暴露了一个更严峻的现实问题:

当进攻能力被高度自动化,人类安全团队必须重新定义自己的角色。

未来真正稀缺的,可能不再是“谁更会扫漏洞”,

而是:谁能判断风险边界、谁能决定 AI 是否该出手、谁为 AI 的行为承担最终责任。

AI 正在成为最强的进攻工具,而人类必须站在监督与决策的位置上。

探索AI驱动安全的系统化实战路径

在AI重塑网络安全攻防格局的背景下,CSA大中华区推出的 AI驱动安全专家认证(CAIDCP),旨在系统构建“AI+安全”深度融合的工程化能力。课程覆盖从智能安全需求分析、设计、开发、测试到运营、审计与伦理治理的全生命周期体系,聚焦于将人工智能技术实际落地于防御、检测与响应全流程。

作为课程的重要组成部分,「AI驱动安全测试」模块深度解析如何将AI应用于现代安全测试场景。内容涵盖:

  • AI辅助的渗透测试与智能攻击向量生成
  • 结合CodeQL与LLM的静态代码审计与漏洞挖掘
  • 基于覆盖反馈的智能模糊测试(Fuzzing)方法
  • AI驱动的动态应用安全测试(DAST)与业务逻辑漏洞挖掘
  • 自动化测试用例生成、结果评估与报告体系构建

通过该模块学习,学员可掌握如何利用AI提升测试覆盖率、降低误报、实现持续自适应安全验证,并将这些能力融入DevSecOps与安全运营体系。

课程基于CSA全球AI安全研究框架与一线科技企业实践,包含十余项实验场景(如AI辅助代码审计、自动化渗透测试、威胁情报分析等)。如您希望体系化掌握AI在主动防御、智能测试与自动化运营中的深度应用,欢迎进一步了解课程详情:

图片

 点击查看课程大纲与报名信息


 

文章参考来源,有部分改动:https://www.businessinsider.com/ai-agent-hacker-stanford-study-outperform-human-artemis-2025-12?utm_source

本文原文翻译支持来自CSA翻译组:杨皓然,CSA大中华区专家

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值