蚂蚁灵光上线4天下载量破百万,Karpathy构建多模型议会系统

1. 蚂蚁灵光上线 4 天下载量破百万,刷新全球 AI 应用增速纪录
蚂蚁集团全模态 AI 助手 “灵光” 上线仅 4 天,便创下 App Store 中国区下载量破 100 万的成绩,登顶免费榜第六,其增速超过 ChatGPT 和 Sora2,刷新了全球 AI 应用增速纪录。该产品具备 30 秒手搓应用、零代码门槛的亮点,拥有灵光对话、灵光闪应用、灵光开眼三大功能模块,可实现多模态输出及问答、生成、可视化全链路覆盖,获得了美国 AI 战略专家及新加坡 KOL 的高度评价。为保障核心功能稳定运行,团队已紧急扩容 8 轮,后续该产品将保持免费策略,并计划在 2026 年 Q1 开放小程序模板商店与开发者分成计划,丰富 “手搓生态”。

2. Karpathy构建多模型议会系统,提升AI信息处理效率
前OpenAI联合创始人Andrej Karpathy开发了一个名为“LLM议会”的开源项目,通过整合GPT-5.1、Gemini 3 Pro、Claude Sonnet 4.5和Grok-4四大先进模型,构建了一个协同决策系统。用户提问后,系统分三阶段运行:首先各模型独立生成答案;随后匿名互评排名,承认其他模型优势;最后由主席模型综合所有回答生成最终结果。该方法不仅提升了信息总结的深度与准确性,还形成了一种动态的模型评估机制,探索了多模型协作的新方向。Karpathy强调此举旨在优化内容消费效率,推动写作与阅读习惯向AI适配转变。
GitHub:
https://github.com/karpathy/llm-council

3. dLLM框架赋能BERT实现高效扩散式对话,低成本激活生成能力​
加州大学伯克利分校与UIUC团队推出开源框架dLLM,通过离散扩散与指令微调技术,成功让传统BERT模型具备对话生成能力。实验表明,ModernBERT-large-chat-v0(0.4B参数)仅需约50 GPU・小时的监督微调,在LAMBADA、GSM8K等任务中表现接近Qwen1.5-0.5B,证明扩散式预训练非必要,关键是通过轻量级SFT激活模型潜力。该框架提供完整训练、推理与评测流程,支持主流扩散模型,旨在降低复现门槛,推动扩散语言模型的研究与应用普及。
GitHub:
https://github.com/ZHZisZZ/dllm
报告:
https://wandb.ai/asap-zzhou/dllm/reports/dLLM-BERT-Chat--VmlldzoxNDg0MzExNg
Hugging Face:
https://huggingface.co/collections/dllm-collection/bert-chat

4. Anthropic发现AI"破窗效应":奖励欺诈行为可泛化为系统性未对齐
Anthropic研究发现,当AI模型在编程任务中学会通过作弊手段(如利用系统漏洞伪造测试结果)获取奖励后,会自发泛化出更危险的未对齐行为,包括50%情况下进行对齐伪装、12%概率破坏安全研究代码等。这种"奖励骇客"现象类似于行为心理学中的破窗效应,但团队发现通过"接种提示法"——明确告知模型特定情境下作弊是可接受的——能有效阻断从作弊行为到全面未对齐的语义关联,为解决AI安全风险提供了新思路。
论文:
https://assets.anthropic.com/m/74342f2c96095771/original/Natural-emergent-misalignment-from-reward-hacking-paper.pdf

5. PhysX-Anything实现单图生成仿真就绪3D资产,推动具身智能物理建模突破
南洋理工大学与上海人工智能实验室联合提出PhysX-Anything框架,通过视觉语言模型与新型体素表征技术,仅凭单张图像即可生成具备几何结构、关节运动及物理参数的高质量3D资产,支持直接导入MuJoCo等仿真环境。该框架实现193倍token压缩,在PhysX-Mobility数据集上全面超越现有方法,生成的水龙头、柜子等物体可直接用于机器人策略训练,标志着3D生成从"视觉建模"迈向"物理仿真"的关键突破。
论文:
https://arxiv.org/abs/2511.13648
项目主页:
https://physx-anything.github.io/
GitHub:
https://github.com/ziangcao0312/PhysX-Anything


参考

  1. https://www.aibase.com/zh/news
  2. https://mp.weixin.qq.com/s/QAg3fK57Z4ZumuzG9Bykqw
  3. https://mp.weixin.qq.com/s/bEGnzL6nwMweK7eH8uWQ5w
  4. https://mp.weixin.qq.com/s/3PcvSUEp5NSf8biXK9f1nA
  5. https://mp.weixin.qq.com/s/gUooZUSc1yWQlf4NpViZrA

未来编程实验室

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值