温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
决策
滚动
控制
目的地
航迹
规划
马晓毓
引用格式:马晓毓,臧绍飞,马建伟,等基于蚁群决策与滚动控制的多目的地航迹规划 电光与控制,():,():基于蚁群决策与滚动控制的多目的地航迹规划马晓毓,臧绍飞,马建伟,张 淼(河南科技大学,河南 洛阳)摘 要:在战时无人机多目的地物资运输任务中,因其复杂的环境和多变的物资需求,存在目的地决策困难和航迹规划实时性要求高的问题。为了解决这一问题,提出一种基于蚁群决策与滚动控制的多目的地航迹规划方法。该方法借助蚁群算法中的寻优机制,建立以最小损耗为目标的多目的地决策函数;此外,采用基于扩充解的滚动时域控制()法,采取边走边决策的策略,进行多目的地航迹规划;最后,为了验证该方法的有效性,在带有障碍物的多目的地环境下进行实验。结果表明,与其他方法相比,所提方法具有规划航路短、产生损耗小的优越性能。关键词:智能决策;航迹规划;无人机;多目的地中图分类号:文献标志码:,(,):,(),(),:;引言随着智能化、信息化时代的到来,现代化战争呈现高技术、高速度、高消耗、快节奏的特点。无人机作为现代战争中必不可少的武器,常被用于执行侦察、物资运输、打击目标等任务。航迹规划作为无人机任务规划的重要组成部分,其规划优劣直接决定了是否收稿日期:修回日期:基金项目:河南省高等学校重点科研项目();河南省重点研发与推广专项(科技攻关)项目()作者简介:马晓毓(),女,河南洛阳人,硕士生。通讯作者:马建伟(),男,河南巩义人,博士,教授。可以精准、安全地完成任务。因此,航迹规划在无人机领域的应用受到广泛研究。航迹规划是指在飞行环境中找到满足要求的平滑航路。航迹规划大体分为两类:几何方法和启发式方法。例如,图和 曲线是典型的几何方法。启发式算法包括 算法、快速随机树()算法、遗传算法()、粒子群优化()算法和蚁群优化()算法等。然而,上述算法均属于全局寻优算法,存在难以适应实时多变环境的局限性。无人机执行任务时环境错综复杂、变化无常,其中,基于约束的多目的地巡航运输是其重要任务之一。但传统航迹规划方法无法满足多目的地巡航运输要 第 卷 第 期 年 月 电 光 与 控 制 马晓毓等:基于蚁群决策与滚动控制的多目的地航迹规划求。针对此问题,文献提出一种基于强化学习的动态调度方法,根据历史和当前状态预判后续变化,采取局部重规划来进行物资调度;文献考虑物资的需求紧迫度等因素利用改进粒子群算法,进行物资运输;在考虑实时物资运输需求时,滚动时域控制()法被广泛使用;文献利用改进 算法,结合 模型与遗传算法对无人机进行任务分配及航迹规划,有效地完成了任务;多目的地物资调运路线的选择属于旅行商问题,在解决该问题时,文献利用改进遗传算法进行求解,实现了全局优化;文献提出新型帝国竞争算法,来获得高质量的解;文献提出一种深度强化学习算法,通过改进注意力机制,实现对环境的感知,来解决动态旅行商问题。上述算法虽然在一定程度上解决了多目的地巡航运输问题,但存在两个不足:一是对实时环境信息利用不足,仅利用历史信息做一次决策,难以应对多变的战场环境;二是仅以航路长度作为目的地决策的判断依据,较为单一。在实际中,需要根据任务考虑多种因素,且大多数算法,将决策与航迹规划分开处理,对实时决策和航迹规划有较少研究。因此,针对战时环境下的多目的地决策和实时航迹规划问题,提出基于蚁群决策与滚动控制的多目的地航迹规划方法。该方法首先根据最小物资损耗,通过蚁群算法建立决策机制选出最优目的地;再采用基于扩充解的滚动时域控制()法进行实时航迹规划;然后在即将到达该目的地时,更新环境信息,并决策出下一个最优目的地;最后得到整体最优航迹及最小损耗。基于蚁群决策与滚动控制的多目的地航迹规划 本文提出的基于蚁群决策与滚动控制的多目的地航迹规划方法流程如图 所示。图 基于蚁群决策与滚动控制的多目的地航迹规划 考虑战时背景下,军事物资配送中的无人机航迹规划与目的地选择问题,在合理简化模型的基础上做出如下假设。)存在多个物资需求点(多目的地)和单个物资配送点(起始地),且各点均已知。各需求点的物资数量和消耗速度,可实时获取并更新。)物资需求时间从物资消耗完开始计算,即在无人机最开始配送物资时,各需求点还有物资。)无人机携带物资数量可满足配送完所有需求点。仅考虑一个配送周期的物资运输,并运送同一种物资。无人机配送完物资不需要再回到起始地。为了使无人机在物资运输过程中,各目的地因物资缺失产生的损耗最小,建立基于蚁群算法的多目的地决策机制,同时,采用在实时、复杂环境下表现良好的 法进行航迹规划,从而完成无人机的巡航运输任务。基于蚁群算法的多目的地智能决策机制为实现无人机对物资配送目的地的智能决策,建立决策机制。首先设计航路长度判断矩阵和物资运送时间判断矩阵,再利用判断矩阵建立最小物资损耗目标函数。使用蚁群算法通过迭代和全局寻优,求取最优目的地序列。在多目的地智能决策机制中,各目的地总物资预测损耗目标函数为 ()式中:为目的地个数;为目的地 的战略重要程度,它按九分制,由专家打分得出;为目的地 的物资损耗量,其算式为()式中,为目的地 的剩余物资量,其算式为 ,()式中:和分别为目的地 的物资量和物资平均消耗速度;,为无人机从起始地到目的地 所需的预计总时长。物资平均损耗速度算式为()式中,和 分别为目的地 物资消耗的最小和最大速度。为了计算无人机到达各目的地的预计时间,建立物资运送时间判断矩阵 为()式中:和 分别为无人机的最大和最小速度;为航路长度判断矩阵,即 第 期,()式中:为目的地个数(不包括起始地);,为从目的地 到目的地 的欧氏距离,且当 时,。根据建立物资运送时间判断矩阵,即,()式中,为无人机从目的地 到目的地 的平均飞行时间。采用蚁群算法对上述目标函数求解,并进行目的地决策。因此,在对信息素的更新中,信息素浓度增量可表示为()式中:为常系数;为蚂蚁 在走完所有目的地后的总损耗。则信息素浓度更新式为()()式中,为信息素挥发因子。在旅行商问题求解中,蚂蚁 从目的地 到目的地 的转移概率为()()其他()式中:和 分别为目的地 与 之间的信息素浓度和距离的倒数;由于 为目的地 与 之间信息素浓度值组成的矩阵,为目的地 和 之间距离的倒数组成的矩阵,因此用“”表示矩阵中的变量;为信息素因子的重要程度;为启发式因子的重要程度;()为蚂蚁 从目的地 出发时,所有未访问的目的地集合。用(,)表示无人机的实际位置坐标,(,)表示目的地坐标,则基于蚁群算法的多目的地智能决策算法如下。算法:基于蚁群算法的多目的地智能决策机制。输入:初始化参数 和 以及无人机实际位置坐标(,)输出:目的地坐标(,)迭代次数()轮盘赌选择目的地()更新()()损耗最小的目的地序列()输出 序列中的第一个目的地(,)。法航迹规划根据前期研究所提的 法,对无人机进行实时航迹规划,算法流程如算法 所示,该算法对应文献中的算法。该算法以预测航路总长与最后预测航迹点到目标点的直线距离之和作为目标函数,利用梯度求解最优航迹。该目标函数与约束条件为(,)(,)()()()约束条件中包括避障约束、无人机速度约束以及飞行动力学约束。式中:(,)为航迹点坐标;为无人机的翼展长度;静态障碍物半径为;位置坐标为(,);为航道曲率半径;为无人机的最小转弯半径;(,)为平滑预测航迹总长;为最后预测航迹点到目标点的直线距离。由于平滑预测航迹由曲线组成,长度很难准确计算,因此,平滑预测航迹用折线长度近似估算,即(,)()()()当 时,(,)为平滑预测航迹的终点。无人机最终目的地到最后航迹点的距离为()()。()算法:基于扩充解的滚动时域法航迹规划。输入:初始化(,),(,),时间窗,时间步长 输出:无人机飞行航路(,)(,)(,)()()()(,),(,),(,),(,)(),(),()(,)定向变异(,),(,)(,),时间窗向前滚动,更新无人机和环境信息 将终点加入(,)输出。算法 中,为时间窗,为时间步长,航路扩充算式为(,)(),第 卷电 光 与 控 制马晓毓等:基于蚁群决策与滚动控制的多目的地航迹规划 (),()式中:为目标方向与飞行方向的夹角,为目标方向与 轴方向的夹角,当飞行方向在目标方向和 轴正方向之间时,角度为 ,当飞行方向在目标方向和 轴正方向之间时,角度为 ;为无人机一秒的最大飞行距离。平均交叉表示为(,)(,)(,)()式中,(,)表示第 条参考路径。单点交叉的思想是先依据交叉概率,选择两条路径,再随机选择位置点(除去首、尾点),对路径进行分割并交换右侧部分,从而得到两条新路径。单点交叉定义为(,)(,),(,)()式中,表示对两条路径进行单点交叉。定向变异通过与航路扩充机制相结合,将变异航路段向目的地方向扩展生成。具体步骤参考文献。整体算法流程为了实现无人机实时决策和在线航迹规划,提出基于蚁群决策与滚动控制的多目的地航迹规划方法。在飞行过程中,损耗是根据物资的平均消耗速度计算的,与实际损耗存在差异。因此,在无人机完成运输任务后,根据获得的真实物资消耗数据,对实际损耗进行计算,即 ()式中:为目的地 的时间成本;为战略重要程度;为平均物资损耗速度。时间成本为 ()式中,和 分别为目的地 的物资送达时间和物资用完时间。其中,物资用完时间是指各目的地初始物资的用完时间,不包含送达物资。基于蚁群决策与滚动控制的多目的地航迹规划方法如算法 所示。其中,使用两个集合 和 来存储已经走过的和未到达的目的地坐标及目的地索引。算法:基于蚁群决策与滚动控制的多目的地航迹规划。输入:初始化参数(,),输出:和 (,)算法 规划无人机飞行航迹算法(,)(,)(,),从 中移除(,)更新各目的地物资信息(,)规划无人机飞行航迹算法()输出 和 。实验 环境设置在二维地图 中,设无人机的初始位置为(,)(,),多目的地参数设置如表 所示。表 多目的地参数信息 目的地位置 初始物资量物资消耗速度范围()战略重要程度(,),(,),(,),(,),(,),(,),(,),由于每个目的地的参数涉及物资量、速度等,参数过多。为方便参数设置以及与不同数量目的地的结果做对比,在设置多目的地的相关参数时,采取 个、个、个目的地递增和包含的形式,因此,表 中仅展示 个目的地的相关参数,而 个目的地和 个目的地的参数取前 个和前 个目的地的参数设置。静态障碍物随机分布在地图之中(除起点和目的地之外),半径在 范围内,数量为。其中,允许静态障碍物重叠,以模拟环境中形状各异的障碍物。无人机的最小转弯半径 ,速度范围为 ,翼展 。法中的参数设置参照文献。蚁群算法中的参数设置为:蚂蚁数量为,迭代次数为,信息素因子的重要程度 ,启发式因子的重要程度 ,信息素挥发因子 ,常系数 。遗传算法中的参数设置为:种群数量为,迭代次数为,选择概率为 ,交叉概率为 ,变异概率为。为验证所提方法的有效性,设置对比实验,如表 所示。由于航迹规划部分均采用 法,因此,对比实验仅考虑决策方法的不同对结果的影响,分别采用蚁群算法、模拟退火法、遗传算法进行实验。经实验发现,除算法运行时间不同外,目的地顺序及产生损耗均一 第 期致。因此,仅选取了其中一种算法(遗传算法)作为对比方法,进行对比说明。表 对比方法中的“仅开始决策 次”是指仅根据初始环境信息计算一次目的地顺序,在飞行过程中,不再根据实时信息多次决策目的地。表 本文方法与对比方法说明 方法说 明本文方法 以最小损耗为目标函数,实时决策的蚁群算法对比方法 以最小损耗为目标函数,实时决策的遗传算法对比方法 以最小损耗为目标函数,仅开始决策 次的蚁群算法对比方法 以最短航路为目标函数,仅开始决策 次的遗传算法对比方法 以最小损耗为目标函数,仅开始决策 次的遗传算法 实验结果与分析为验证所提方法 的可行性和有效性,分别在不同目的地数量的环境下进行实验。并将结果与表 中的 种情况(对比方法,)做对比。为了消除随机因素的影响,上述算法独立执行 次,结果分别如图、图 和表 所示。由于篇幅限制,图中仅展示 个和 个目的地的航迹规划结果,表中将展示所有实验结果。结合图、图 和表