- 博客(4)
- 收藏
- 关注
原创 HybridVLA详解
框架的核心是采用大型语言模型作为决策中枢,该模型创新性地整合了扩散模型和自回归模型的双重优势:扩散模型通过渐进式去噪过程生成稳健的动作方案,而自回归模型则确保动作序列的时序连贯性。整个流程中,各模块通过紧密协作实现动作的集成优化,其中扩散去噪机制有效提升了动作生成的稳定性,自回归机制则保证了复杂任务中动作序列的合理性。该系统的核心架构包括视觉编码器、标记器、多层感知机和大语言模型(2.7B/7B参数),采用扩散动作去噪与自回归动作解码的并行协作机制,实现高效的动作生成与集成。
2025-06-09 19:17:09
298
原创 生成式决策——以Diffusion Policy为例
生成式决策是一种运用深度学习技术,通过生成模型对数据分布进行完整的策略整合,再从完整策略分布中重新采样生成新动作的技术。在上,传统强化学习依赖动态规划(如TD学习)和策略梯度来进行策略优化,而生成式决策则是通过扩散模型等生成模型来直接生成状态轨迹。在方面,传统强化学习通过策略网络直接输出动作,而生成式决策则利用逆动力学模型从状态序列中解码出动作,具备更强的建模灵活性。在上,传统强化学习以最大化累计奖励为目标,而生成式决策追求最大化条件轨迹的相似性,更关注行为的合理性与可解释性。在。
2025-06-09 16:38:38
915
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1