Datawhale分享
作者:姚顺宇,谷歌DeepMind
清华物理系传奇特奖得主Yao Shunyu(姚顺宇),官宣离开 Anthropic,加入 Google DeepMind。

姚顺宇介绍来源:APPSO
2015 年,姚顺宇进入清华物理系,2019 年本科毕业拿了凝聚态与材料物理学学士学位。本科期间把清华最高荣誉——特等奖学金收入囊中,同时还获得叶企孙物理奖。
2019 年本科毕业后,姚顺宇直奔斯坦福大学理论与数学物理系读博。导师是两位大牛——Douglas Stanford 和 Stephen Shenker。博士研究方向主要围绕量子场论与量子引力的动力学特性,以及它们与量子信息、数学的交叉领域。

2024 年 10 月,姚顺宇正式加入 Anthropic Claude 团队,开始搞大模型研究。
截至 2025 年,其论文总引用次数达到 5020 次(其中 2020 年后积累了 4678 次),h 指数为 14。
姚顺宇在最新的领英中同时更新了一篇博客,详细总结了这一年在 AI 领域的经历。
我的AI研究元年——从物理学转向AI
在我离开加州大学伯克利分校博士后职位并加入 Anthropic 之后不久,我打算写一篇短文,主要是自己离开物理学加入人工智能研究的思考过程的笔记。
然而,由于 Anthropic 的工作非常紧张,我从未有时间将这些想法写下来:)直到上周五(9 月 19 日),我从 Anthropic 辞职,并在加入谷歌 DeepMind 之前得到了一周的休息。
一、为什么我离开物理学,又为什么选择人工智能
主要是因为我想找到一个年轻人有更多机会的方向。理论物理学是一个训练场:它充满智力挑战,深邃,需要来自广泛领域的技巧,包括数学、计算机科学(例如,复杂性理论)以及当然,物理学本身。然而,这个领域已经多年没有实验了。一个没有实验的领域在许多不同的方面都可能存在问题,例如,很难客观地判断理论工作的重要性。仅通过系统性的实验也很难解开分歧/困惑。
然后主要就是人工智能或量子计算了。虽然我相信量子计算在未来会变得重要,但我的印象是现在的瓶颈主要是实验平台。因此我选择了人工智能,它有趣地与物理学研究相似:
二、作为一名物理学家,从事人工智能研究的感觉是怎样的?
在某种程度上,这类似于17世纪对热力学的研究。当时,人们甚至不知道什么是热:事实上,人们仍然相信燃素说。但这并没有阻止人们进行科学实验。例如,波义耳定律描述了在温度固定时压力和体积之间的关系。因此,通过系统地设计实验,人们仍然学到了足够的“定律",这些定律指导了热机的发明/研究,改变了世界。
从我的天真观点来看,在大规模 AI 模型中也是如此。一方面,我们仍然没有可靠的理论或模型来描述大型神经网络的运行行为。另一方面,系统性的研究开始告诉我们许多宝贵的经验,例如规模定律。(而且,进行这些系统性的研究正成为在大规模上持续进步的必要元素。)
三、为什么选择Anthropic,又为什么选择离开
尽管我离开了 anthropic,我仍然认为 ant是物理学家(也许还有其他 STEM 背景的博士)开始 AI 研究旅程的最佳场所之一。我于 2024 年 10 月 1 日加入 anthropic,当时我们开始研究后来被称为 Claude 3.7 sonnet 的项目。在做了多年物理学家之后,看到自己的研究立即对前沿模型能力产生影响,并见证人们与 AI 互动的方式随着新能力的出现而改变,这真是太令人兴奋了
然而,我决定离开,主要基于两个原因:
1. 40%的原因:我强烈反对 Anthropic 所发表的反对中国的言论。尤其是最近的公开声明中,将中国称为“敌对国家”。虽然要明确的是,我相信 Anthropic 的大多数人都会反对这样的说法,然而,我认为我无法继续留在这里。
2. 剩余的60%更复杂。其中大部分涉及Anthropic的内部信息,因此不便透露。
四、时间该继续前进了!
与物理学相比,人工智能发展得非常快,回顾过去的一年,我惊讶于发生了多少事情。看到 Claude 从 3.7 提升到 4.5,我感到非常荣幸,并且我个人也学到了很多。然而,现在是时候继续前进了。
从个人角度来看,Anthropic 是我第一个,也是唯一一个与人工智能相关的工作,因此我不想我的经验/知识受到特定实验室的偏见。(特别是现在核心研究不再写论文了。)
所以,Ant,和你在一起是美好的,但没有你更好:)
我于9月29 日加入谷歌 DeepMind。

参考资料:
https://alfredyao.github.io/posts/2025-10-06.html
https://www.linkedin.com/feed/update/urn:li:activity:7381177462564642816/


一起“点赞”三连↓
2万+

被折叠的 条评论
为什么被折叠?



