Ballistic Missile Midcourse Intelligent Maneuver Strategy Based on PPO Algorithm
本文提出了基于近点策略优化(PPO)强化学习算法的弹道导弹机动策略,使弹道导弹能够在中段规避拦截器。首先,大气层外的接触过程被建模为马尔可夫决策过程。弹道导弹的推力被视为代理人的作用,能量消耗被视为代理人的奖励。重要的是,观测仅包含导引头角度及其变化率,没有距离、速度和加速度估计,因此可以应用于大气层外的被动寻的导引头。模拟显示,基于PPO算法的弹道导弹剂能够以100%的成功率躲避拦截弹。与传统的微分博弈方法相比,基于强化学习的方法可以将观测数据映射到偏转推进器命令,从而大大缩短了实时计算的时间。
Development overview of Russian ballistic missile and missile defense system
俄罗斯弹道导弹及导弹防御系统发展综述,对分析地区安全格局具有重要意义
二战以来,弹道导弹与弹道导弹防御系统技术已成为各大国间战略制衡、竞相发展的焦点领域。俄罗斯继承了冷战时期前苏联遗留的弹道导弹及防御技术,并在既有基础上开展了大量创新与发展工作。俄罗斯弹道导弹秉持海、陆、空三位一体的发展战略,逐步转变了原有的以陆基为主、海空为辅的战略目标。俄罗斯弹道导弹防御系统沿用前苏联规划方案,以保卫本土重要目标为核心宗旨。本文重点梳理俄罗斯弹道导弹及弹道导弹防御系统的发展历程与发展现状,并对其弹道导弹及反导系统的未来发展趋势展开预测与分析。
Reentry-phase Tracking of a Ballistic Missile in the Presence of Radar Glint Noise
在雷达闪烁噪声存在下弹道导弹的再入阶段跟踪
提出了克服雷达眩光噪声影响的框架,用于弹道导弹再入阶段跟踪。闪烁噪声的特征是概率密度函数,且带有重尾效应。在这种情况下,传统的高斯测量噪声建模不适用。采用高斯噪声假设设计的滤波器,在遇到异常值时因闪烁噪声而导致性能损失。在本研究中,经典的扩展卡尔曼滤波器(EKF)采用了稳健的M估计程序,考虑了带有重尾部的测量噪声分布。该方法在均方根误差方面相比标准版本的EKF和UKF有显著改进。本研究保留了使EKF成为状态估计首选方法的所有优点(如简洁性和计算效率),同时增加了鲁棒性。建议的技术通过三维弹道导弹再入模型的模拟实验得到验证
Distributed observer-based fixed-time cooperative guidance law against maneuvering target
本文提出了一套固定时间协同制导定律,适用于引导跟随导弹,包括一枚带目标导引头的导弹和若干无导引头跟随导弹。其目标是在预期的撞击角度下实现对机动目标的同时攻击。首先,提出了基于非奇异快速末端滑动模式(NFTSM)控制算法的导弹撞击角度控制的制导定律。随后,跟随导弹的协同制导规律设计由两部分组成:沿跟随者至引导导引线(LOS)方向,基于双齐次性质的制导指令设计确保跟随导引导弹射程与导弹的射程保持比例共识,从而避免估算发射时间();在正常的跟随者到引导线视线方向,考虑由导线视线角度决定的相对冲击角约束,基于预定时间滑动模式控制方法提出制导指令。此外,为跟随导弹设计了分布式定时观察器,以补偿无法获得的导弹信息。所提方法的固定时间稳定性通过李雅普诺夫理论和双齐次性质得以证明。最后,模拟结果确认了拟定时间合作指导定律与领导者跟随策略的有效性和优越性。
Optimal guidance law of air to surface missile with terminal impact angle constraint
具有末端撞击角约束的空对地导弹的最优制导定律
近年来,随着武器格斗的转变,终点角度约束的制导方法日益受到关注。考虑到飞机撞击目标时的着陆速度和速度下降条件,基于零再入载具和目标视角率的理念,设计用于攻击地面固定目标的最佳再入制导定律,即提高导弹精度,使导弹快速命中目标,并对终端角度限制设定严格要求。采用最优控制理论,当飞机击中目标以满足终端角度约束条件时,确保再入飞行器机动速度降至最小损失。
1256

被折叠的 条评论
为什么被折叠?



