温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
考虑
先验
信息
机器人
重点
区域
协同
覆盖
http:/DOI:10.13700/j.bh.1001-5965.2021.0435考虑先验信息的多机器人重点区域协同覆盖段安娜1,2,周锐1,邸斌3,*(1.北京航空航天大学自动化科学与电气工程学院,北京100191;2.中国电子科技集团公司航天信息应用技术重点实验室,石家庄050081;3.中国人民解放军军事科学院国防科技创新研究院,北京100171)摘要:针对复杂环境下的多移动机器人对重点目标区域协同持续监视覆盖问题,假定在目标区域内分布着若干障碍及固定观测点,已获得固定观测点处所关心的目标参量历史测量数据,考虑为机器人群规划一组监视路径,以实现对重点目标区域高覆盖率、高频率的监视覆盖。建立多机器人协同持续监视问题的数学模型;基于小脑模型神经网络(CMAC)对区域内固定观测点的测量数据进行学习泛化以获得区域内目标参量估计;利用基于传感器配置-路径框架划分的路径规划组合策略以求得各机器人优化路径。仿真实验验证了模型和求解方法的有效性。关键词:协同覆盖;小脑模型神经网络;多机器人;路径规划;粒子群优化方法中图分类号:TP242.6文献标志码:A文章编号:1001-5965(2023)06-1479-08在枯燥、恶劣和危险环境中执行任务时,多机器人系统具有很强的适用性和鲁棒性,受到了研究人员的广泛关注。其中,多机器人协同覆盖是一个关键性问题。协同覆盖问题考虑使用多个机器人对目标区域进行持续性地覆盖,在复杂环境中完成诸如监视、侦察、探测、巡查等类型的任务,要求设计出总体效能最优的多机器人路径规划方案。多机器人协同覆盖涉及多条路径的规划问题,需考虑设计多条路径以覆盖目标区域内的所有关键节点,且要求路径间互不干涉,尽量减少重复覆盖。常见的协同覆盖方法通常采用分层递阶基于区域分解的求解思路,即先将目标区域划分为与各机器人对应的子区域,从而把问题简化为若干个单机器人的考虑区域覆盖问题,之后再为每个机器人在对应子区域上规划覆盖路径即可。对于规则形状和非复杂区域,可先根据各机器人的能力对目标区域进行初等几何划分,再利用简单的扫描式、内螺旋式覆盖模式进行覆盖探索。对于不规则形状区域及含障碍的情况,可采用精确的元胞分解方法,如梯形分解1、牛耕式分解2、Morse-based 分解3等,将自由空间(不含障碍)分解成互不重叠的子区域,而后分别进行覆盖;还可采用基于几何的方法利用可见图生成路径,图中节点代表位置,边是不通过障碍物的线段,其中 Voronoi 图法最为常用4;此外,Gabriely 和 Rimon5提出一种用于移动机器人的生成树覆盖算法,该算法将工作空间细分为网格图,可生成满足环境约束的螺旋路径,目前基于生成树的覆盖算法已成为一种重要的路径规划方法6-8。然而,基于区域分解的求解思路是基于目标区域各坐标位置均具有同等重要程度的假设而做出的,而现实中,往往更关心一些特定的局部子区域的实时状态。如车站、广场等公共场所,人群密集度高的地方发生危险事件的概率更大;又如化工工收稿日期:2021-08-02;录用日期:2022-03-04;网络出版时间:2022-03-2215:41网络出版地址: J.北京航空航天大学学报,2023,49(6):1479-1486.DUAN A N,ZHOU R,DI B.Multi-robot cooperative coverage of key regions considering prior informationJ.Journal of BeijingUniversity of Aeronautics and Astronautics,2023,49(6):1479-1486(in Chinese).2023年6月北京航空航天大学学报June2023第49卷第6期JournalofBeijingUniversityofAeronauticsandAstronauticsVol.49No.6厂、核工厂等场地,污染物浓度高,辐射强度大的区域危险系数高,往往也是预先可估计的。因此,需要以这些目标参量信息高的区域为巡查重点,对这些重点区域进行更高频率的覆盖监视。对于此类目标区域存在局部先验信息的情况,要求解决目标区域评估和多机器人路径规划 2 个层面问题,此时简单的基于区域分解的求解思路不再适用。具体来说,首先考虑利用局部目标参量先验信息,对整个目标区域进行评估,确定并量化需重点关注的子区域,在全局上形成关于目标区域的参量信息图;随后就可在区域参量信息图的基础上,为多机器人进行路径规划,从而实现有侧重的持续性区域协同覆盖。对于第 1 层面的目标区域评估问题,要求通过有限的局部目标参量信息,实现对环境中其他坐标信息的估计。以往的研究常采用高斯过程(Gaussianprocesses,GPs)对环境进行建模,文献 9 进一步基于最大化互信息以求得最优的传感器位置点。本文设计一种基于小脑模型神经网络(cerebellarmodelarticulationcontroller,CMAC)的参量信息估计方法,CMAC 起源于 Albus 受小脑模型启发设计的机械臂控制器,之后逐渐发展为应用于建模、估计及控制的通用网络模型10。CMAC 具有局部性、计算效率高等特点,适合于在线学习训练11。文献12将 CMAC 与强化学习中 sarsa 算法相结合,并针对典型任务取得较好效果,亦有研究者将其应用于导弹及基于视觉的移动机器人控制等13-14。对于第2 层面的多机器人路径规划问题笔者已在以往的工作15中进行了较为详尽的研究,且基于一种传感器配置-路径框架划分的组合分层优化策略求解了多种不规则形状区域和障碍环境下的多机器人协同覆盖问题。本文在其基础上,综合考虑 2 个层面的问题,将文献15 的方法扩展到存在局部先验信息的情况,实现考虑先验信息的多机器人重点区域协同覆盖问题的优化求解。1问题建模与描述考虑多移动机器人对某一目标区域进行持续协同监视覆盖,目标区域内分布着若干外形不规则的障碍物及数量有限的固定观测点,如图 1 所示。ROIRfRoRfRo=ROIRfRo=、和分别为目标区域、可到达区域和障碍区域,目标区域由障碍区域和可到达区域组成,即,且。各固定观测点安装的传感器可测量该点处的目标参量(如人群密集度,污染物浓度等),得到各固定观测点处带噪声的Oi=oi目标参量随机测量值数据,记为固定观测点 i 处的测量值集合。rd考虑由 N 台探测半径为 的移动机器人协同对可到达区域进行持续监视,机器人在运动过程中需避开障碍区域,且机器人探测视线也会受到障碍区域的遮蔽。机器人对可到达区域进行重复探测与持续监视,则将其对探测范围内某点相邻 2 次探测之间时间间隔定义为监视覆盖周期 T,而监视覆盖频率则为 f=1/T。为便于计算,假定机器人沿可到达区域内的闭合路径匀速运动,并且其探测半径与路径长度相比可忽略,则机器人探测周期可近似为T=s/v,其中,s 和 v 分别为路径长度和机器人速度。vvfg(v,f)已知区域内各固定观测点的测量值集合,假设可到达区域内各状态点(x,y)的目标参量值与其所在位置有关。显然,目标参量值大的点应以更高的频率进行覆盖监视,假定移动机器人对其监视区域内某一点持续监视所获得收益与该点目标参量值及监视覆盖频率相关,记为,则多机器人群体监视覆盖收益可建模为P=xRfg(v,f)dxdy(1)由此定义多移动机器人协同区域持续覆盖监视问题为:考虑由若干移动机器人对存在若干不规则障碍的目标区域进行持续监视覆盖,机器人探测范围及移动速度受限,如何有效利用固定观测点的目标参量信息以及规划各机器人移动路径以实现机器人群体总收益最大化。2求解策略由于第 1 节所述多机器人协同区域持续监视覆盖问题的开放性和复杂性,提出基于目标参量估计-传感器配置-路径框架划分的组合求解策略,如图 2 所示。在已有固定观测点目标参量数据情况目标区域固定观测点障碍物图1复杂目标区域及固定观测点示意图Fig.1Schematicdiagramofcomplextargetareaandfixedobservationpoint1480北 京 航 空 航 天 大 学 学 报2023年下,首先基于 CMAC 对可到达区域内的目标参量进行估计;之后利用探测半径为机器人探测半径 2 倍的虚拟传感器对可到达区域进行覆盖,得到虚拟传感器配置点;之后考虑目标参量信息适当定义 2 个配置点之间的距离度量,求解旅行商问题得到经过所有配置点的闭合路径,作为机器人移动的路径框架;最后考虑目标参量信息及机器人覆盖周期,求解路径框架划分问题,求得与机器人数量相等的路径框架分段,各机器人沿各自分段运动即实现对重点区域的优化监视覆盖。2.1基于 CMAC 的目标参量估计CMAC 作为一种函数逼近局部算法被广泛应用在各类学习系统中,CMAC 能够快速地做出局部推广和泛化,在学习过程中,对于每组新增的输入输出数据,只需调整少量的连接权值就能满足新映射关系的要求。因此,考虑利用 CMAC 对固定观测点目标参量数据集进行泛化,计算整个可到达区域内的目标参量估计值,从而完成对全局参量信息图的构建。Wj将目标区域内各点的位置坐标视为状态,即网络输入;将各点的目标参量视为状态取值,即网络输出。基于“瓦片编码”的方式对 CMAC 的思想进行描述11,16:对状态空间进行划分,划分出的每个子空间被称为“瓦片”,为产生局部泛化,需要多个交叠覆盖且彼此有所偏移的划分,并由这些多个交叠覆盖且彼此偏移的划分生成状态的特征表示。即每一层划分与一个权值特征向量相对应,如果状态点位于划分中的某一瓦片,则表示该瓦片所对应j v的特征被激活,考虑使用二值激活向量,特征被激活时相应分量取值为 1,反之取值为 0,则基于加权和表示状态点处的目标参量估计值 为 v=Mj=1TjWj(2)Wjjjj式中:M 为划分层数;为第 层划分的权值特征向量;为第 层划分的激活向量。多个交叠覆盖的划分及不同划分中的被激活的瓦片示意图如图 3所示11。图3CMAC 多个交叠覆盖划分示意图11Fig.3SchematicdiagramofCMACwithmultipleoverlappingcoveragepartitions11基于随机梯度下降(stochasticgradientdescent,SGD)方法对所搭建的 CMAC 模型进行学习训练,其核心思想是利用数据集中每一个目标参量测量值的真实样本不断迭代,从而使各权值特征向量朝减少样本误差的方向不断趋近。其主要步骤如下:步骤1准备输入数据。准备各固定观测点位置状态及目标参量观测值,记观测点 k 位置状态及目标区域信息及观测点数据信息障碍物固定观测点基于CMAC的目标参量估计旅行商问题求解闭合路径划分问题求解连接虚拟传感器配置点的闭合路径(机器人运动路径框架)各机器人持续覆盖监视优化路径目标参量估计值251109802468 10746传感器配置问题求解覆盖监视区域的目标参量估计值虚拟传感器配置点图2考虑先验信息的多机器人重点区域协同覆盖问题求解策略示意图Fig.2Schematicdiagramofsolutionstrategyformulti-robotcooperativecoverageofkeyregionswithpriorinformation第6期段安娜,等:考虑先验信息的多机器人重点区域协同覆盖1481Ik=(sk,Ok)0W=W0测量数据记为二元组;设置初始化参数:步长、权值特征向量初始值。oikwk=wk1,wk2,wkMwk wk+(oik vk)e vk步骤2对于每次测量中每个观测点处的数据(以第 i 次测量中观测点 k 处的数据为例),执行如下操作:找到其在各划分中激活的瓦片及其所对应的权值,组成权值向量,更新权值向量:,其中 由式(2)计算可得,e 为单位向量。步骤3算法终止,输出各划分中各瓦片权值。v利用固定观测点目标参量数据集,经由随机梯度下降方法对 CMAC 模型进行学习训练,获得目标参量估计模型后,即可由式(2)求得区域内各状