AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

近年来,大语言模型(LLMs)的发展已将研究前沿从解谜任务推进至科学级推理——即能够应对那些答案必须经受自然规律检验、而不仅符合评分标准的复杂问题。物理学是衡量这一转变的最严苛标准,因为它以根本性方式将符号系统与现实世界相联结,是现代大多数技术的基石。

基于此,来自上海人工智能实验室的研究团队通过开发具备卓越物理推理能力的大规模语言模型,成功推动了物理学研究的进展,尤其在解决国际奥林匹克物理竞赛(Olympiad-level)级别问题方面表现突出。研究人员提出了 P1 系列开源物理推理模型,该系列模型完全通过强化学习(RL)进行训练。其中,P1-235B-A22B 是首个在 2025 年国际物理奥林匹克竞赛(IPhO 2025)中取得金牌水平表现的开源模型,并在 2024 至 2025 年度的 13 项国际及区域性物理竞赛中斩获 12 枚金牌。

论文链接https://go.hyper.ai/NxT8f

最新 AI 论文https://go.hyper.ai/hzChC

为了让更多用户了解学术界在人工智能领域的最新动态,HyperAI超神经官网(hyper.ai)现已上线「最新论文」板块,每天都会更新 AI 前沿研究论文。以下是我们为大家推荐的 5 篇热门 AI 论文,一起来速览本周 AI 前沿成果吧 ⬇️******

本周论文推荐

1. Lumine: An Open Recipe for Building Generalist Agents in 3D Open World

本文提出 Lumine,这是首个开源的通用 Agent 开发方案,能够实现在复杂三维开放世界环境中实时执行长达数小时的复杂任务。Lumine 采用类人类交互范式,通过视觉-语言模型,以端到端的方式统一感知、推理与行动。它以每秒 5 帧的频率处理原始像素输入,生成每秒 30 帧的精确键盘鼠标操作,并仅在必要时动态调用推理模块。

论文链接 https://go.hyper.ai/wfGhN

在这里插入图片描述

Lumine 模型概述

2. YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception

本文提出 YOLOv13,一种高精度且轻量级的目标检测器。研究人员提出一种基于超图的自适应相关性增强机制(Hypergraph-based Adaptive Correlation Enhancement, HyperACE),该机制能够自适应地挖掘潜在的高阶相关性,突破了以往方法仅限于基于超图计算的成对相关性建模的局限,实现了高效的全局跨位置、跨尺度特征融合与增强。

论文链接 https://go.hyper.ai/cKMGI

在这里插入图片描述

模型架构图

3. Generating an Image From 1,000 Words Enhancing Text-to-Image With Structured Captions

本文首次训练了一款基于长结构化描述的开源文本到图像模型 FIBO,其中每个训练样本均标注了相同的一组细粒度属性。该设计极大扩展了表达能力,并实现了对视觉因素的解耦控制。为高效处理长描述,研究人员提出 DimFusion 机制——一种无需增加 token 长度即可融合轻量级大语言模型(LLM)中间 token 的融合方法。

论文链接: https://go.hyper.ai/zyUcE

在这里插入图片描述

FIBO 工作流程

4. Depth Anything 3: Recovering the Visual Space from Any Views

本文提出Depth Anything 3(DA3),一种能够从任意数量的视觉输入中预测空间一致几何结构的模型,无论输入是否包含已知的相机位姿。研究人员构建了一个全新的视觉几何基准,涵盖相机位姿估计、任意视角几何重建以及视觉渲染任务。在该基准上,DA3 在所有任务中均取得了新的最先进性能,相较于先前的最先进方法 VGGT,相机位姿估计准确率平均提升 44.3%,几何重建准确率平均提升 25.1%。

论文链接 https://go.hyper.ai/WvSU4

在这里插入图片描述

工作流程图

5. P1: Mastering Physics Olympiads with Reinforcement Learning

本文通过开发具备卓越物理推理能力的大规模语言模型,成功推动了物理学研究的进展,尤其在解决国际奥林匹克物理竞赛(Olympiad-level)级别问题方面表现突出。我们提出了 P1 系列开源物理推理模型,该系列模型完全通过强化学习(Reinforcement Learning, RL)进行训练。

论文链接 https://go.hyper.ai/NxT8f

在这里插入图片描述

训练数据中的一个样本

以上就是本周论文推荐的全部内容,更多 AI 前沿研究论文,详见 hyper.ai 官网「最新论文」板块。

同时也欢迎研究团队向我们投稿高质量成果及论文,有意向者可添加神经星星微信(微信号:Hyperai01)。

下周再见!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值