2月18日,被马斯克称为“地球上最聪明的人工智能”Grok 3推理模型亮相。发布会直播现场,他和带队工程师分坐两旁,将C位留给了两位主要负责模型研究的华人科学家。
四人中唯一身穿浅色上衣的年轻人(图中右二),引起了很多人的关注。他就是来自杭州的95后学霸——吴宇怀。
发布会直播截图
马斯克AI公司联合创始人之一
是杭州95后学霸
吴宇怀是是名95后,xAI的联合创始人,建德人,初中就读于杭州建兰中学,随后转到加拿大读高中,后来进入多伦多大学就读于人工智能专业并获得博士学位。随后在斯坦福大学师从两位著名教授Percy Liang和Jay McClelland,完成了博士后研究。
吴宇怀曾在DeepMind和OpenAI实习,吴宇怀的主要研究方向是打造具备推理能力的机器,是自训练增强推理模型STAR、语言模型Minerva、定理证明器Alpha Geometry等项目的作者或核心贡献者,在国际顶会发表过诸多论文,比如在《Nature》上发表论文《Solving Olympiad Geometry Without Human Demonstrations》。这篇论文详细描述了Alpha Geometry项目的设计和成效。论文讨论了如何通过合成大量的定理和证明来训练AI模型,以解决高难度的几何问题,标志着AI在数学推理领域的一个重要突破。2018年,吴宇怀在母校建兰中学和自己的数学老师陆韵合影 图片由受访者提供据任课老师们回忆,吴宇怀在初中时各方面就非常优秀,各门功课都拔尖。
建兰中学校长陆韵当时担任吴宇怀的数学老师。“他的数学非常好,学习很会思考,也很轻松。”陆校长记得,初中时,吴宇怀研究一道数学难题,“死磕”了一天后成功解出。当时,他加了八条辅助线。比较有意思的是,吴宇怀在初中时语文也非常出色,是语文课代表。
吴宇怀曾在一次分享中介绍,他立志于创造一个善于推理的人工智能,用于解决所有数学难题,他以数学作为研究推理的起点,目标是创造一个自动化的AI“数学家”。此前,他的部分研究被《Quanta Magazine》《纽约时报》报道。
发布会现场的另一位华人科学家Jimmy Ba(图中左二),他在多伦多大学完成本科、硕士及博士学习。
他的研究重点是深度神经网络的高效学习算法开发,还涉足强化学习、自然语言处理和人工智能等领域。他是训练深度学习模型的首选算法之一Adam optimizer的开发者。Adam optimizer即自适应矩估计优化器,是深度学习常用算法,由Jimmy Ba和另一名科学家在2014年提出。
2016年,Jimmy Ba获得了Facebook机器学习研究生奖学金;2023年2月,荣获斯隆研究奖。
越来越多华人
成为这一轮AI浪潮的有力推动者
眼下在AI领域,越来越多华人正在展示自己的实力,成为这一轮人工智能浪潮的有力推动者。据橙柿互动此前报道,算上吴宇怀和Jimmy Ba,xAI创始团队12人中,就有5张华人面孔。
比如张国栋,本科就读于浙江大学信息工程专业,大学时连续三年排名专业第一,拿了三年的国家奖学金,还获得过全国大学生数学建模竞赛一等奖,美国大学生数学建模竞赛一等奖。大二时,他对人工智能产生了浓厚兴趣,投入到计算机视觉领域的研究中;大三暑假,跟着全球著名计算机视觉专家朱松纯从事相关研究。
另一位联合创始人杨格出生在湖南,本硕就读于哈佛大学数学系,大学时期的导师是数学家丘成桐。在加入xAI前,他是微软的高级研究员。
还有一位戴子航,本科就读于清华大学工商管理学,硕博就读于卡内基梅隆大学计算机科学学院。他曾在网易、百度深度学习研究所、谷歌有过实习经历,2020年成为谷歌大脑的研究科学家。
看到张栋梁的身影,有位浙大的创业者调侃:说好的全球AI竞争,咋变浙大内部PK了呢?也是在2月18日,DeepSeek发布全新论文,提出了一种新的注意力机制——NSA,发布两个小时,就有近30万的浏览量。毕业于浙大的创始人梁文锋也是作者之一。
难怪圈子里有人表示:“马一龙这个AI的含华(人)量还挺高,应该能成。”
Grok团队成员还透露,Grok-3的语音交互功能是通过原生语音交互模型实现的,模型将能够直接理解用户语音,然后生成对应的语音回复,是一个端到端的过程,无需语音转文字、文字转语音作为中间环节。
马斯克称,未来他们将会进一步加大数据中心的建设力度,xAI的下一个计算集群会成为世界上最强大的集群,能耗达到1.2GW,相当于数十万户家庭1年的用电量。