温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
ROC
理论
UUV
协同
探雷
任务
分配
方法
研究
范学满
收稿日期:2021-09-05修回日期:2021-11-07作者简介:范学满(1989-),男,山东青岛人,博士,助理研究员。研究方向:智能指挥决策。通信作者:薛昌友(1969-),男,江苏南京人,教授。研究方向:指挥信息系统。*摘要:时间受限条件下,传统计划搜索和随机搜索模式难以满足多 UUV 协同探查水雷任务的效率需求。针对多 UUV 协同探雷的任务分配问题,为了充分利用各 UUV 的探测资源,在尽可能短的时间内获得尽可能精确的水雷分布概率图,提出一种基于 ROC 理论的最小权重算法。该算法通过优化搜索通道、引入变深惩罚项以及考虑距离代价等措施,提高了算法的鲁棒性和环境适应能力。进行了仿真验证和算法性能对比分析。关键词:多无人潜航器;探查水雷;任务分配;ROC 曲线;信息增益中图分类号:TJ61+1;TP181文献标识码:ADOI:10.3969/j.issn.1002-0640.2022.11.012引用格式:范学满,刘星璇,薛昌友.基于 ROC 理论的多 UUV 协同探雷任务分配方法研究 J.火力与指挥控制,2022,47(11):64-70.基于 ROC 理论的多 UUV 协同探雷任务分配方法研究范学满,刘星璇,薛昌友*(海军潜艇学院,山东青岛266199)Study on Task Assignment of Multi-UUV Coordination MineDetection Based on ROC TheoryFAN Xueman,LIU Xingxuan,XUE Changyou*(Navy Submarine Academy,Qingdao 266199,China)Abstract:Under time constraints,the traditional planned search and random search modes aredifficult to meet the efficiency requirements of multiple unmanned underwater vehicle(multi-UUV)coordination mine detection task.Aiming at the task allocation problem of multi UUV coordinationmine detection,in order to make full use of the detection resources of each UUV and to obtain the minedistribution probability map as accurate as possible in the shortest possible time,a minimum weightalgorithm based on ROC theory is proposed.By optimizing the search channel,introducing the variabledepth penalty term and considering the distance cost and other measures,the algorithm improves therobustness and environmental adaptability of the algorithm.Finally,the simulation verification and theperformance comparison of the algorithm are carried out.Key words:multi-UUV;mine detection;task assignment;ROC curve;information gainCitation format:FAN X M,LIU X X,XUE C Y.Study on task assignment of multi-UUV coordinationmine detection based on ROC theory J.Fire Control&Command Control,2022,47(11):64-70.0引言水雷是一种重要的战略战术武器,在封锁海上通道及港口、进行攻势布设等方面发挥着重要作用1。随着无人作战装备的快速发展,UUV 在反水雷作战(mine counter-measures,MCM)中受到各国海军的极大关注。为了克服单个 UUV 在航程、载荷能力和自主水平等方面的局限,需要利用多个 UUV协同进行 MCM 作战,从而发挥无人集群作战能力的涌现性2-3。多 UUV 协同探雷任务通常较为紧急,且探雷效能很大程度上取决于任务分配方案的优劣4-5,在给定时间内利用计划搜索(环形搜索、弓文章编号:1002-0640(2022)11-0064-07Vol.47,No.11Nov,2022火 力 与 指 挥 控 制Fire Control&Command Control第 47 卷第 11 期2022 年 11 月64(总第 47-)形搜索等)或随机搜索难以有效覆盖待查海域6。针对上述问题,文献 7 将待探查区域均匀划分为有限多个足够小的单元,综合考虑待探查单元存在水雷的不确定性以及 UUV 与待探查单元的距离,为各 UUV 分配距离尽可能近、完成任务所得信息量尽可能大的探查单元,经过多轮“分配-探查-再分配-再探查”得到水雷分布概率图。在时间受限情况下,任务分配方法的效率尤为重要,粒子群8、进化算法9等启发式方法难以满足实时性要求,而贪婪式算法的效率优势显著10。文献 7 中的最小权重算法(minimalweight algorithm,MWA)虽然在基于最小距离和基于最大信息增益的两类贪婪式算法间取得了较好的均衡,但在权重度量和水雷分布后验概率计算方面有待进一步改进。一方面,在进行距离度量时,只考虑 UUV 与待探查水雷间的欧式距离,没有考虑 UUV 转向、变深机动的时间耗费;另一方面,在进行信息增益度量和水雷分布后验概率计算时,均基于水雷分布先验概率与0.5 的偏差大小进行确定性计算,未考虑传感器信噪比、虚警率等环境密切相关因素的实际影响。本文针对 MWA 算法的不足,在进行距离度量时引入变深惩罚项,并且基于受试者工作特征(re-ceiver operating characteristic,ROC)11理论对搜索通道进行优化分析,从而将传感器信噪比、虚警率等环境密切相关因素纳入考虑,提出一种基于 ROC理论的最小权重算法(minimal weight algorithm basedon ROC,MWA-ROC),该算法考虑了 UUV 机动损耗和 UUV 探查虚警率对分配方案的影响,更贴近水下不确定性应用场景,具有更强的鲁棒性和环境适应性。1基于 ROC 理论的离散搜索信道多 UUV 协同探雷过程中的信息流与通信信道中的信息传输类似,包括编码、信道传输、解码 3 个主要步骤,如图 1 所示。原始信息即水雷真实分布情况记为 M,任务分配相当于编码器对 M 进行编码得到水雷探查计划,编码后的信息经搜索信道传输到达解码器,根据探查结果估计得水雷近似分布。在任务时间受限情况下,为使水雷估计分布尽可能接近真实分布,需要合理构建搜索信道模型、精心设计任务分配方法,从而支持多 UUV 在有限时间内搜索尽可能多的未知区域,获得尽可能多的水雷分布信息量。1.1二进制非对称单元搜索信道在进行搜索信道建模前,首先需要对待探查的雷区环境进行建模。为了更贴近实际应用场景,与文献 12-13 将 UUV 的活动区域限制在二维平面不同,本文研究水下三维空间中的协同探雷任务。如图 2 所示,将待探查区域 R 划分为 L 个立方体单元,假设每个单元足够小仅能容纳一个水雷,且划分结果满足互斥性和归一性,(1)水雷分布在部分单元中,水雷真实分布记为(2)在区域 R 中,如果存在一个水雷 x 位于单元中,则该单元状态为 1,反之为 0,即(3)经探查后所得的水雷估计分布为(4)时间受限情况下,的质量与任务分配方案和搜索信道状况决定。图 2三维水下空间及划分单元示例对于单元 Cl存在水雷的初始概率(先验概率),可通过预先侦察得到或根据历史经验进行假定。进行任务分配时,为每个 UUV 指定一个单元进行探查,若将 Cl分配给 UUVi探查,完成后根据探查结果可得 Cl存在水雷后验概率(5)式中,dl0,1 为 Cl的探查结果,dl=1 表示 UUV 判断 Cl存在水雷,反之,表示 UUV 判断 Cl不存在水雷。综上所述,对于真实分布作为输入、估计分布作为输出的信道,输入和输出都只有 0、1 两种状态,交叉组合共 4 种传输情况,可以抽象为一个二分类问题,符合如下页图 3 所示的二进制非对称离散信道形式。图 1搜索通道中的信息流范学满,等:基于 ROC 理论的多 UUV 协同探雷任务分配方法研究651919(总第 47-)火 力 与 指 挥 控 制2022 年第 11 期图 3二进制非对称离散信道以存在水雷的单元为正例,反之为负例,分类结果组成的列联表如表 1 所示。表 1二分类结果列联表则图 3 中的 4 个概率可表示为(6)式中,PTP为水雷被正确检出的概率,称为检出率;PFP为疑似目标被错误判别为水雷的概率,称为虚警率。由图 3 和式(6)可知,检出率 PTP和虚警率 PFP是表征传输信道质量的基本属性,也是计算 UUV完成对某一单元探查所得信息增益的基础,下文基于 ROC 曲线进行分析。1.2搜索信道的 ROC 分析ROC 曲线源自“二战”中用于敌机检测的雷达信号分析技术,以虚警率 PFP为横坐标,以检出率 PTP为纵坐标。对于水雷探查中的二进制非对称离散信道,作业环境和 UUV 传感器性能共同决定 ROC 曲线,换言之,信噪比 SNR 不同,ROC 曲线也不同。图4 中给出了 SNR=2、SNR=3 和 SNR=5 时 对 应 的ROC 曲线,可见信噪比越高,水雷探查效果越好。ROC 曲线上的点称为操作点,操作点与检测阈值 th 相对应。对于单元 Cl,探查虚警率为6(7)式中,thl为单元的检测阈值;为自由度为 4 的卡方分布;为伽玛函数;为分布的生存函数。信噪比、阈值和虚警率确定后,可得检出率(8)式中,为分布的逆生存函数;SNRl为单元 Cl内的信噪比。由图 4 可见,检出率 PTP和虚警率 PFP是一对矛盾,为了达到 PTP尽可能大、PFP尽可能小的目的,本文选择 ROC 曲线上最左上方,即(PTP-PFP)最大的点作为操作点,实现较为平衡的探查效果。例如,SNR=2 时,ROC 曲线的平衡点如图 4 中“”所示,对应的阈值 th=6.6、PTP=0.699、PFP=0.158。1.3搜索单元的信息增益度量假定由 UUVi对单元 Cl进行探查,信噪比 SNRl和检测阈值 thl确定后,即可根据式(7)、式(8)计算探查检出率 PTP和虚警率 PFP。若 UUVi的探查结果为 dl,则 UUVi探查 Cl所得的信息增益可用信道输入和输出的互信息14-15表示。(9)式中(10)其中,为水雷初始分布的先验熵;为探查完成后的条件熵;为边缘检测概率。给定探查结果后,单元 Cl存在水雷的后验概率为(11)预测真实10合计1真正例(true positive,TP)假负类(false negative,FN)实际正例数TP+FN0假正例(false positive,FP)真负例(true negative,TN)实际负例数FP+TN图 4不同 SNR 对应的 ROC 曲线661920(总第 47-)进而,得式(10)中的后验熵为(12)综上所述,本文利用式(9)进行 UUV 探查单元所得信息量计算,利用式(11)基于探查结果进行单元存在水雷概率的更新。2基于 ROC 理论的最小权重算法任务分配是多 UUV 协同作战的重