Grok 4作战图刷爆全网,80%华人横扫硅谷!清华上交校友领衔,95后站C位

来源 | 新智元

短短两年,马斯克Grok 4的横空出世,让xAI团队一举站上AI之巅。

图片

昨日一小时发布会,Grok 4让所有人大开眼界,直接刷爆了AIME 2025、人类最后的考试(HLE)两大基准。

这是狂堆20万GPU才换来的惊人成果,更具体讲,Grok 4算力飙涨了100倍。

图片

xAI团队成员自豪地表示,「Scaling强化学习才是正确的路」!

图片

而如今,硅谷大佬的目光不再只是AI模型的发布,其背后的顶尖团队才是关注的C位。

尤其是,在当前疯狂抢人大战之际,小扎又在瞄准下一波候选人了。

图片

也就是同一时间,xAI员工Daniel晒出了Grok 4团队作战图迅速刷屏。

一眼望去,80%的面孔几乎都是华人学者。

图片

图片

斯坦福博士毕业,现xAI研究员Xuechen Li感慨道,一小群顶尖人才在极致专注下的爆发力,竟能在极短时间内取得如此巨大的成就」!

图片

图片

Grok 4发布会之后的狂欢

接下来,一起盘点Grok 4身后的顶配华人天团都有谁?

图片

Grok 4背后天团,华人占比惊人

先来看,能够坐镇发布会,紧挨马斯克的两位华人学者。

他们也算是xAI对外公开的老熟人了,上次Grok 3直播同样坐在了老马的身旁。

图片

Grok 4发布会上,图片最右边是Jimmy Ba,多伦多大学计算机科学助理教授,AI大佬Hinton的学生,创始团队一员。

图片

另一位是xAI联创吴怀宇(Tony Wu),多伦多大学博士,妥妥的95后,也曾是AlphaGeometry、AlphaStar核心开发者。

图片

其他华人学者还包括:

Greg Yang(杨格)

杨格是xAI创始成员之一。

他本硕就读于哈佛大学数学系,导师是数学家丘成桐,并于2018年荣获摩根奖(Morgan Prize)荣誉奖。

在加入xAI之前,他曾是微软的高级研究员,负责AI理论研究。

图片

Zihang Dai(戴子航)

戴子航本科毕业于清华大学计算机科学系,师从著名计算机视觉专家朱松纯开展研究。

此外,他还获得了CMU硕士和博士学位。

他曾是前谷歌大脑研究员,在自然语言处理(NLP)领域拥有深厚的积累,尤其擅长Transformer架构的优化与创新。

图片

Guodong Zhang(张国栋)

张国栋于2017年获得了浙江大学学士学位,并于2022年获得了多伦多大学博士学位。

博士毕业后,他曾加入谷歌DeepMind任研究科学家。

图片

Shengyang Sun

Shengyang Sun在xAI领导AI专家团队。

他于2022年获得了多伦多大学计算机博士学位,于2017年获得了清华学士学位。

入职xAI之前,他曾在英伟达就职1年多,任高级研究科学家;在亚马逊担任过应用机器学习科学家。

图片

Bill Yuchen Lin(林禹臣)

林禹臣现任xAI研究员兼华盛顿大学(UW)客座助理教授,专注于LLM对齐、AI智能体训练、推理及多模态大模型。

他于2022年获得了南加州大学博士学位。他还曾拿下了上海交通大学IEEE荣誉班的学士学位,在校期间获校级优秀毕业论文奖。

图片

Xuechen Li

Xuechen Li分别获得了斯坦福大学计算机科学系的硕士和博士学位,在此之前,还曾拿到多伦多大学学士学位。

公开资料显示,他还曾就读于北京四中。

在加入xAI之前,他曾在谷歌任学生研究员,并在微软实习了四个月。

图片

Tianle(Tim)Li

Tianle(Tim)Li在xAI专注于Grok模型的后训练工作。

在此之前,他曾获得了UC伯克利EECS学士学位,并参与了著名的LMArena竞技平台的研发。

图片

Haotian Liu

Haotian Liu是Grok-1.5V、Grok-2、Grok-3的核心开发者。

他于2024年获得了威斯康星大学麦迪逊分校获得博士学位,师从Yong Jae Lee教授。

在此之前,他还曾获得了浙江大学获得学士学位,并拿到了优秀毕业生的称号。

图片

Lianmin Zheng

Lianmin Zheng曾获得了UC伯克利完成了博士学位,导师是Ion Stoica和Joseph E. Gonzalez教授。他本科就读于上海交通大学ACM班。

值得一提的是,他曾和团队共同创立了非营利组织LMSYS.org,致力于推进开源大语言模型研究。

图片

Jiacheng Hong

Jiacheng Hong于2012年获得了CMU硕士学位,本科曾就读于上海交通大学。

入职xAI之前,他曾在Pinterest任职12年,担任工程主管。

图片

Qian Huang

Qian Huang本科就读于康奈尔大学数学和计算机科学系,目前仍是斯坦福大学博士生(2027年毕业),同时也是xAI技术员之一。

图片

Yiwen Yuan

Yiwen Yuan曾获得了CMU计算机科学计算机系学士和硕士学位。

目前,她在xAI是一名技术员,曾在一家Kumo.AI初创任技术主管。

图片

Su Yan

Su Yan本科毕业于华北电力大学计算机系,并于2017年获得了南加州大学计算机硕士学位。

他的个人职业经历非常丰富,曾在Airbnb担任高级软件工程师、在TikTok任技术主管。

图片

Yikang Shen

Yikang Shen曾获得了北京航空航天大学计算机学士和硕士学位,还获得了蒙特利尔大学计算机博士学位。

此前,他在IBM任研究科学家,专注于打造下一代更高效的大模型。

图片

Wenhan Xiong

Wenhan Xiong曾获得了中国科学技术大学学士学位和UCSB的博士学位。

毕业后,他便加入了Meta GenAI团队任AI研究科学家,是 Llama2/3、CodeLlama的核心作者。

图片

还有一位研究员Yifei Zhou甚至暂停了UC伯克利博士学位,也要加入xAI参与最先进模型

图片

此外,xAI团队中参与Grok 4华人成员还有,Yuchen He、Tianyi Zhang、Xinlei Chen、Jihui Yang等等。

图片

刚刚,马斯克点评:xAI办公室氛围很nice!

图片

图片

一夜登顶,xAI首次夺魁!

除了xAI官方发布的数据,独立评测机构Artificial Analysis也在第一时间公布了对Grok 4模型的全方位基准测试结果。

最引人注目的是,Grok 4在「Artificial Analysis智能指数」中以73分的成绩拔得头筹,显著超越了一众顶级模型。

包括OpenAI o3(70分)、谷歌Gemini 2.5 Pro(70分)、Anthropic Claude 4 Opus(64分)和DeepSeek R1 0528(68分)。

图片

细分能力表现如下:

  • 代码与数学能力制霸:在「编码指数」(LiveCodeBench & SciCode) 和「数学指数」(AIME24 & MATH-500) 两大关键领域中均排名第一

图片

图片

  • 刷新高难度测试纪录

    • 在GPQA Diamond测试中取得了88%的历史最高分,大幅刷新了Gemini 2.5 Pro此前84%的纪录

    • 在「人类最后的考试」中以24%的成绩创下历史新高,超越了Gemini 2.5 Pro的21%

  • 多项全能:在MMLU-Pro和AIME 2024两项测试中,分别取得了87%和94%的最高分

图片

  • 速度:每秒输出75个token。慢于o3(188 token/s)和Gemini 2.5 Pro(142 token/s),但快于Claude 4 Opus(66 token/s)

  • 上下文窗口:256k token。低于Gemini 2.5 Pro的100万token(1m),但优于Claude 4 Sonnet/Opus(200k) 和o3(200k)

  • 其他关键特性

    • 支持文本和图像输入(多模态能力)

    • 支持函数调用和结构化输出

图片

最后,在定价方面,Grok 4延续了Grok 3的策略,即每百万输入/输出token分别为3美元/15美元。

这一价位与Claude 4 Sonnet持平,但高于Gemini 2.5 Pro(1.25美元/10美元)和近期降价后的o3(2美元/8美元)。

图片

不过,根据知名大佬「karminski-牙医」的实测,Grok 4的代码基准结果,有过拟合的嫌疑。

不管是已经用到包浆的「七边形小球弹跳」测试,还是刚做出来的「拆烟囱」测试,Grok 4的表现都不如旧版DeepSeek R1。

甚至,生成的代码还得靠Claude debug之后,才能跑……

图片

,时长00:54

图片

,时长00:31

参考资料:

https://x.com/LiTianleli/status/1943445775981404598

07-29
Grok-4 是一个与大型语言模型相关的项目,由埃隆·马斯克支持的 xAI 团队开发。尽管关于 Grok-4 的具体技术细节和训练数据没有完全公开,但根据已知信息,Grok-4 被认为是一个具有强大语言理解和生成能力的模型,能够处理包括自然语言理解、代码生成、逻辑推理等复杂任务。该模型的设计目标之一是支持实时信息处理,因为它与马斯克旗下的社交平台 Twitter(现为 X)集成,能够访问实时数据流[^1]。 Grok-4 的训练数据来源未明确公布,但推测其训练数据集包含大量互联网文本,可能包括 X 平台上的实时对话数据。这种训练方式使得 Grok-4 在对话交互、情绪理解和内容生成方面表现出色,适用于聊天机器人、智能客服和内容创作等应用场景。 关于模型的架构和参数规模,虽然具体数字尚未公开,但从其前代 Grok-3 的公开资料来看,Grok-4 可能拥有数十亿甚至数百亿参数,以支持更复杂的语言任务。此外,Grok-4 的开发团队 xAI 与特斯拉的 Dojo 项目有潜在的技术协同,这可能意味着 Grok-4 在训练过程中利用了先进的计基础设施。 至于模型的下载信息,Grok-4 目前并未完全开源,仅限于特定用户和合作伙伴使用。如果需要访问 Grok-4 或其衍生版本,通常需要通过官方渠道申请,例如加入 X 平台上的特定测试计划或与 xAI 团队直接联系。此外,Grok-4 的 API 接口也可能提供给开发者用于构建应用程序,但具体的使用权限和费用结构尚未详细披露[^1]。 ### 代码示例 以下是一个简单的 Python 示例,展示如何调用 Grok-4 的 API(假设 API 已开放): ```python import requests def call_grok4_api(prompt): url = "https://api.grok-4.com/generate" headers = { "Authorization": "Bearer YOUR_API_KEY", "Content-Type": "application/json" } data = { "prompt": prompt, "max_tokens": 150 } response = requests.post(url, headers=headers, json=data) return response.json()['text'] # 示例调用 response = call_grok4_api("请解释什么是量子计?") print(response) ``` ### 相关问题 1. Grok-4 的训练数据来源是什么? 2. 如何申请使用 Grok-4 的 API? 3. Grok-4 与 GPT-4 在性能上有哪些差异? 4. Grok-4 是否支持多语言处理? 5. Grok-4 的推理能力如何?
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值