2025-12-30 11:26:3739浏览
卫星任务规划 / 敏捷卫星 / 调度 / 深度强化学习 / 两阶段方法 / 马尔可夫决策过程
深度强化学习 / 强化学习培训 / 数字孪生培训 / 大模型培训 / 智能体培训 / 具身智能培训
针对敏捷卫星对地观测任务可见时间窗多且冲突复杂所导致任务难以调度的问题,提出一种基于深度强化学习的两阶段卫星任务调度方法。通过对卫星敏捷能力的剥夺和再赋予将原问题转换为常规卫星任务调度问题的“退化”阶段和已有任务调度方案在敏捷能力加持下的再调整问题的“增强”阶段,并提出深度补强网络作为Q网络的深度强化学习算法求解增强阶段。通过仿真实验表明,该两阶段方法在多种规模场景下调度卫星对地观测任务效果更优。