1. 阿里千问启用qianwen.com新域名
阿里旗下 AI 助手 “千问” 正式启用全新域名qianwen.com,网页端不仅能与 App 端实现无缝一致的使用体验,还向专业用户开放了 Qwen3-Max-Thinking-Preview、Qwen3-Coder 等十余款 Qwen3 系列模型,增设代码、深度研究以及对话分组等适配 PC 端的功能。作为阿里进军 AI to C 市场的核心项目,千问基于全球性能第一的开源模型 Qwen3,以免费及生活场景生态结合的优势与 ChatGPT 竞争,其自 11 月 17 日开启公测后成绩亮眼,一周内 App 全网累计下载量便突破 1000 万次,超越 ChatGPT 等同期表现。
2. Claude Opus 4.5重磅发布:能力全面跃升,价格大幅下调三分之二
Anthropic正式推出新一代旗舰模型Claude Opus 4.5,在编程、智能体操作、计算机使用等核心领域实现多项突破,尤其在软件工程测试(SWE-bench)中超越GPT-5.1等主流模型达到SOTA水平。本次更新最大亮点是定价策略的调整,输入/输出Token费用降至每百万5/25美元,较上代直降三分之二,显著降低使用门槛。同步升级的还包括开发者平台的effort参数控制、长对话稳定性增强,以及Excel等办公场景的深度集成,同时模型在安全性和抗提示注入攻击方面亦有显著提升。
模型系统卡:
https://assets.anthropic.com/m/64823ba7485345a7/Claude-Opus-4-5-System-Card.pdf
3. 微软推出本地运行智能助手 Fara-7B
微软发布了拥有 70 亿参数的本地运行计算机智能助手 Fara-7B,该助手属于计算机使用智能助手,凭借小巧体积突破企业数据安全障碍,可让敏感工作流自动化处理且数据无需离开设备;它通过像素级视觉数据识别网页并执行操作,在 WebVoyager 基准测试中任务成功率达 73.5%,超越 GPT-4o 等模型,且完成任务步骤更少、效率突出;其具备 “关键点” 识别功能,搭配 Magentic-UI 界面,能在关键操作时请求用户批准以规避风险;该模型体现了知识蒸馏趋势,微软已在特定平台提供其 MIT 许可版本供实验和原型开发,但暂不适用于关键任务部署,未来还将进一步优化智能水平。
Hugging Face:
https://huggingface.co/microsoft/Fara-7B
4. UniLumos:引入物理反馈的统一图像视频重打光框架,实现20倍加速与真实光影重塑
NeurIPS 2025提出的UniLumos框架通过引入RGB空间的几何反馈机制(深度图与法线图),将物理约束融入扩散模型,有效解决了传统重光照方法中高光过曝、阴影错位等物理不合理问题。该框架结合路径一致性学习,在保持SOTA级别生成质量的同时,将推理速度提升约20倍,并构建了细粒度评估基准LumosBench,支持对光照方向、强度等六大属性的自动化可解释评估,实现了图像与视频重光照任务中高质量与高效率的统一。
论文:
https://arxiv.org/abs/2511.01678
GitHub:
https://github.com/alibaba-damo-academy/Lumos-Custom
ComfyUI支持:
https://github.com/kijai/ComfyUI-WanVideoWrapper
5. OpenAI与Anthropic联手推动MCP Apps标准化
MCP社区正式发布MCP Apps提案(SEP-1865),由OpenAI和Anthropic核心团队联合主导,旨在为Model Context Protocol协议引入交互式用户界面支持标准。该提案通过标准化UI资源声明、工具链接及双向通信机制,使AI智能体能够直接提供可视化操作界面(如仪表盘、表单等),将传统文本交互升级为图形化体验,同时确保向后兼容性和多层安全防护,标志着AI交互从"命令行"迈向"图形化"的重要变革。
早期访问SDK:
https://github.com/modelcontextprotocol/ext-apps
你也可以贡献,地址:
https://github.com/modelcontextprotocol/modelcontextprotocol/pull/1865
6. 谷歌Nano Banana Pro引爆AI应用新玩法:论文变漫画、手写解题以假乱真
谷歌Nano Banana Pro近期被AI大牛田渊栋和卡帕西发掘出多种创新应用,包括将学术论文转化为漫画海报、精准识别并解答手写题目并模仿真人笔迹输出答案,以及生成个性化健身计划等可视化功能,展现了AI在图像理解与生成领域的突破性进展。这些应用不仅获得社区高度关注,还体现了AI交互从纯文本向"智能画布"图形化界面的演进趋势,同时谷歌CEO通过AI生成的汉堡结构图幽默回应8年前的emoji争议,进一步凸显了AI在物理逻辑理解上的进步。
参考
- https://www.aibase.com/zh/news
- https://mp.weixin.qq.com/s/cTD-vqtuQXiC6AxBmnYOzQ
- https://mp.weixin.qq.com/s/5AMkIj1nSHFckh9aKOicNw
- https://mp.weixin.qq.com/s/X3ljj6gRZOXM_xWmqAu2ig
- https://mp.weixin.qq.com/s/hdaWHn-WtJGDZehVKExiVQ

5762

被折叠的 条评论
为什么被折叠?



