
在硅谷被大语言模型(LLM)狂热席卷的当下,Meta首席AI科学家、图灵奖得主Yann LeCun再次站在了主流叙事的对立面。这并非为了博取眼球,而是基于对智能本质的深刻洞察。在他看来,试图通过堆砌更多算力、合成数据和强化学习来让LLM进化为超级智能,不仅是徒劳的,更是“完全的胡扯(complete bullshit)”。
LeCun不仅在言语上犀利,更在行动上另辟蹊径——他成立了新公司Advanced Machine Intelligence (AMI),旨在跳出硅谷的“单一同质化文化”,全力押注世界模型(World Models)与联合嵌入预测架构(JEPA)。这场赌注的核心观点令人深省:通往AGI的必经之路,不是让机器更好地“说话”,而是让机器拥有像猫狗一样的“物理常识”。
硅谷的集体迷失:由于LLM引发的幻觉
当前的AI行业似乎陷入了一种集体无意识:所有的科技巨头都在做同样的事情。OpenAI、Google、Anthropic都在同一条赛道上狂奔——扩大模型规模、清洗数据、做后训练(Post-training)。LeCun将这种现象称为硅谷的“单一同质化文化”(Monoculture),每个人都在盯着竞争对手,生怕掉队,却忽略了路可能本身就是错的。
文本数据的贫瘠与物理世界的丰饶
LeCun指出了LLM根本性的阿喀琉斯之踵:数据带宽的极度不对称。
训练一个高性能LLM通常需要互联网上几乎所有的文本数据,大约是30万亿个Token(约字节)。这听起来是个天文数字。然而,如果将其与视觉数据对比,这仅相当于约1.5万小时的视频数据量。而

最低0.47元/天 解锁文章
1434

被折叠的 条评论
为什么被折叠?



