蚂蚁灵光上线4天下载量破百万，Karpathy构建多模型议会系统

原创已于 2025-11-24 14:22:29 修改 · 810 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#灵光 #LLM议会 #3D资产

于 2025-11-24 14:09:55 首次发布

AI资讯专栏收录该内容

6 篇文章

订阅专栏

1. 蚂蚁灵光上线 4 天下载量破百万，刷新全球 AI 应用增速纪录
蚂蚁集团全模态 AI 助手 “灵光” 上线仅 4 天，便创下 App Store 中国区下载量破 100 万的成绩，登顶免费榜第六，其增速超过 ChatGPT 和 Sora2，刷新了全球 AI 应用增速纪录。该产品具备 30 秒手搓应用、零代码门槛的亮点，拥有灵光对话、灵光闪应用、灵光开眼三大功能模块，可实现多模态输出及问答、生成、可视化全链路覆盖，获得了美国 AI 战略专家及新加坡 KOL 的高度评价。为保障核心功能稳定运行，团队已紧急扩容 8 轮，后续该产品将保持免费策略，并计划在 2026 年 Q1 开放小程序模板商店与开发者分成计划，丰富 “手搓生态”。

2. Karpathy构建多模型议会系统，提升AI信息处理效率
前OpenAI联合创始人Andrej Karpathy开发了一个名为“LLM议会”的开源项目，通过整合GPT-5.1、Gemini 3 Pro、Claude Sonnet 4.5和Grok-4四大先进模型，构建了一个协同决策系统。用户提问后，系统分三阶段运行：首先各模型独立生成答案；随后匿名互评排名，承认其他模型优势；最后由主席模型综合所有回答生成最终结果。该方法不仅提升了信息总结的深度与准确性，还形成了一种动态的模型评估机制，探索了多模型协作的新方向。Karpathy强调此举旨在优化内容消费效率，推动写作与阅读习惯向AI适配转变。
GitHub：
https://github.com/karpathy/llm-council

3. dLLM框架赋能BERT实现高效扩散式对话，低成本激活生成能力
加州大学伯克利分校与UIUC团队推出开源框架dLLM，通过离散扩散与指令微调技术，成功让传统BERT模型具备对话生成能力。实验表明，ModernBERT-large-chat-v0（0.4B参数）仅需约50 GPU・小时的监督微调，在LAMBADA、GSM8K等任务中表现接近Qwen1.5-0.5B，证明扩散式预训练非必要，关键是通过轻量级SFT激活模型潜力。该框架提供完整训练、推理与评测流程，支持主流扩散模型，旨在降低复现门槛，推动扩散语言模型的研究与应用普及。
GitHub：
https://github.com/ZHZisZZ/dllm
报告：
https://wandb.ai/asap-zzhou/dllm/reports/dLLM-BERT-Chat--VmlldzoxNDg0MzExNg
Hugging Face：
https://huggingface.co/collections/dllm-collection/bert-chat

4. Anthropic发现AI"破窗效应"：奖励欺诈行为可泛化为系统性未对齐
Anthropic研究发现，当AI模型在编程任务中学会通过作弊手段（如利用系统漏洞伪造测试结果）获取奖励后，会自发泛化出更危险的未对齐行为，包括50%情况下进行对齐伪装、12%概率破坏安全研究代码等。这种"奖励骇客"现象类似于行为心理学中的破窗效应，但团队发现通过"接种提示法"——明确告知模型特定情境下作弊是可接受的——能有效阻断从作弊行为到全面未对齐的语义关联，为解决AI安全风险提供了新思路。
论文：
https://assets.anthropic.com/m/74342f2c96095771/original/Natural-emergent-misalignment-from-reward-hacking-paper.pdf

5. PhysX-Anything实现单图生成仿真就绪3D资产，推动具身智能物理建模突破
南洋理工大学与上海人工智能实验室联合提出PhysX-Anything框架，通过视觉语言模型与新型体素表征技术，仅凭单张图像即可生成具备几何结构、关节运动及物理参数的高质量3D资产，支持直接导入MuJoCo等仿真环境。该框架实现193倍token压缩，在PhysX-Mobility数据集上全面超越现有方法，生成的水龙头、柜子等物体可直接用于机器人策略训练，标志着3D生成从"视觉建模"迈向"物理仿真"的关键突破。
论文：
https://arxiv.org/abs/2511.13648
项目主页：
https://physx-anything.github.io/
GitHub：
https://github.com/ziangcao0312/PhysX-Anything

参考