- 博客(3)
- 收藏
- 关注
原创 KF01 - 观测合并
摘要:本文研究了多传感器系统中的观测合并策略,通过选择性融合高精度观测来优化系统性能。研究通过卡尔曼滤波实验对比了标准方法(融合全部观测)和手动合并方法(仅保留高精度观测)。实验结果表明:1)标准方法具有理论最优性,估计方差始终≤手动方法;2)当低精度观测噪声增大时,两种方法差异减小;3)手动方法在特定场景下可显著降低计算量,适合嵌入式系统应用。研究为工程实践中观测合并策略的选择提供了量化依据,证明在算力受限时可合理舍弃低精度观测而不显著影响系统性能。
2026-01-07 18:05:16
342
原创 RL-01:Q-Learning算法理解及实例应用
Q-Learning是强化学习领域经典的无模型(Model-Free)时序差分(Temporal Difference,TD)学习算法,由Chris Watkins于1989年提出。它的核心目标是学习动作价值函数(Action-Value Function)Q(s,a),该函数表示智能体在状态s下执行动作a后,能够获得的长期累积奖励期望。Q-Learning不依赖环境模型,直接通过与环境的交互经验更新价值函数,适用于离散状态和离散动作空间的强化学习任务。
2026-01-01 18:31:26
867
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅