“当前AI连猫的智慧都不如!”杨立昆呼吁放弃强化学习与概率模型

部署运行你感兴趣的模型镜像

杨立昆(Yann LeCun)是人工智能领域的先驱之一,现任Meta首席AI科学家、纽约大学教授,2018年因在深度学习领域的开创性贡献(尤其是卷积神经网络的研究与应用)与Yoshua Bengio、Geoffrey Hinton共同获得图灵奖,被誉为“卷积网络之父”。

他出生于法国,早年在巴黎第六大学获得计算机科学博士学位,后师从Geoffrey Hinton完成博士后研究,奠定了其在神经网络领域的学术地位。

作为Meta AI研究的核心领导者,杨立昆长期致力于推动机器智能的边界。他不仅是技术理论的奠基者(如反向传播算法、自监督学习框架的提出),也是技术落地的实践者,曾参与开发DjVu图像压缩技术、Lush编程语言等。

近年来,他聚焦于突破现有AI系统的局限性,主张从“暴力计算”转向“物理世界理解”,并提出下一代AI的核心架构——“世界模型”(World Model)。

在学术立场上,他以直言著称,多次公开批评当前主流的大语言模型(如GPT系列)缺乏对物理世界的常识理解,认为其智能水平甚至不及家猫。

同时,他呼吁行业放弃对生成式模型、强化学习等技术的过度依赖,转向更接近人类认知的推理架构(如能量基模型和联合嵌入预测架构)。

他的观点兼具批判性与前瞻性,既揭示了AI发展的技术瓶颈,也为未来十年机器智能的演进绘制了清晰的路线图。

对当前AI技术的批判与反思

生成式模型的局限性

杨立昆指出,以GPT为代表的大语言模型(LLM)依赖自回归生成模式,通过预测下一个词元(token)构建输出,但这种方式存在根本性缺陷:

  • 推理发散性:生成过程中错误会指数级累积,导致“幻觉”(即输出不合理内容)。

  • 缺乏物理世界理解:尽管模型在语言处理、考试解题等任务中表现优异,但无法像人类或动物一样通过少量经验学习物理常识(如物体恒常性、重力),更难以完成如收拾餐桌、驾驶汽车等需要与环境交互的任务。

  • 数据效率低下:四岁儿童通过视觉输入(约10^14字节)即可形成对世界的基础认知,而大模型需消耗同等量级的文本数据却仍无法实现类似理解。

对强化学习与概率模型的质疑

他认为强化学习依赖试错机制,难以应用于复杂现实场景,而概率模型在预测不确定性时效率不足。因此,他呼吁“放弃生成式模型、概率模型、对比方法和强化学习”。

未来AI发展的技术方向

构建“世界模型”与能量基推理系统

杨立昆提出,下一代AI需基于世界模型(World Model),能够预测物理世界行为并规划行动。其核心架构包括:

  • 联合嵌入预测架构(JEPA):通过抽象表示空间预测视频中的关键变化,而非逐帧生成,从而提升对物理规律的理解。

  • 能量基模型(Energy-Based Models):通过能量函数衡量输入与输出的兼容性,允许系统根据问题复杂度动态调整推理时间,模拟人类“系统二”的理性思考过程。

  • 层次化规划能力:从宏观目标(如“去巴黎”)到微观动作(如“按下电梯按钮”)的分层规划,解决当前机器人技术中动作分解的难题。

高级机器智能(AMI)的愿景

杨立昆反对“通用人工智能(AGI)”的表述,主张以**高级机器智能(AMI)**为目标,其核心特征包括:

  • 从感官输入中学习物理常识;

  • 具备持久记忆与复杂推理能力;

  • 可控性及内置安全机制。

多模态与节能技术

他预测未来AI需整合视觉、听觉等多模态数据,并开发更高效的算法以降低能耗。Meta正探索核能作为低排放能源支持大规模计算,同时推动模型小型化与硬件优化。

对行业生态与社会影响的观点

  1. 开源与协作的必要性

    杨立昆强调,实现人类水平的AI助手需全球协作,避免少数公司垄断技术。开源平台能促进文化多样性,确保AI系统适配不同语言、价值观与社会需求。

  2. 伦理与安全的平衡
    他反对过度监管技术研发,主张将监管重心置于应用层面。同时,通过“护栏目标”(Guardrail Objectives)硬编码约束AI行为,确保安全性。

  3. 对中国AI发展的评价
    杨立昆赞赏中国科学家与企业的创新能力,特别提及DeepSeek模型的高效表现,认为中国在AI领域正迅速崛起。

技术革命的预测与挑战

杨立昆预测,未来3-5年AI领域可能迎来架构级革命,突破现有模型的局限性,但实现家用机器人或完全自动驾驶仍需更长时间。

其团队正探索视频生成与机器人技术结合的新范式,目标是开发能推理、规划并预测行为后果的智能体系统。

结语

杨立昆的思考体现了对AI技术现状的深刻批判与对未来的务实展望。

他主张从“暴力计算”转向“物理理解”,从单一模态扩展至多感官融合,并通过开源协作与伦理设计推动AI的健康发展。这些观点不仅为学术界指明方向,也为产业界提供了从技术到生态的全面路线图。

您可能感兴趣的与本文相关的镜像

Qwen3-VL-8B

Qwen3-VL-8B

图文对话
Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型,这一代在各个方面都进行了全面升级:更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力,以及更强的代理交互能力

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值