行星
动力
下降
约束
最优
反馈
制导
方法
第44卷第8 期2023年8 月宇航学报Journal of AstronauticsVol.44No.8August2023行星动力下降多约束最优反馈制导方法张晓文1,王天舒,王大轶”,李骥(1清华大学航天航空学院,北京10 0 0 8 4;2 北京控制工程研究所,北京10 0 190;3.北京空间飞行器总体设计部,北京10 0 0 94)摘要:为实现行星定点着陆,针对E制导和零控位移偏差/零控速度偏差(ZEM/ZEV)制导的不足,提出多约束下动力下降最优反馈制导方法。首先,在分析E制导性质的基础上,提出制导时长初值的高效选取方法和基于预测校正的优化方法,经少量迭代实现在推力范围受限且连续变推力约束下推进剂消耗接近最优。接着,提出基于碰撞规避时长和推力优化分配律的地平碰撞规避方法,并在此基础上利用坐标系旋转,给出满足下滑角约束的碰撞规避方法,显著提高碰撞规避能力和着陆点可见性。之后,提出匀速转动制导和基于预测校正的组合制导参数规划方法,使制导终端扩充满足加速度约束。最后,数学仿真表明新方法有效,多约束适应性强,计算量相对小,适合工程应用。关键词:行星着陆;动力下降;最优反馈制导;E制导;零控位移偏差/零控速度偏差中图分类号:V448.233D0I:10.3873/j.issn.1000-1328.2023.08.006Multi-constraint Optimal Feedback Guidance forZHANG Xiaowen-2,WANG Tianshu,WANG Dayi,LIJ?(1.School of Aerospace Engineering,Tsinghua University,Bejing 100084,China;2.Beijing Institute of ControlEngineering,Beijing 100190,China;3.Beijing Institute of Spacecraft System Engineering,Beijing 100094,China)Abstract:For planetary pinpoint landing,an optimal feedback guidance of powered descent with multiple constraints ispresented to overcome the limitations of E-guidance and zero-effort-miss/zero-effort-velocity(ZEM/ZEV)guidance.Firstly,based on the analysis of the properties of E-guidance,an efficient method for the initial guess of time-to-go and anoptimization method based on predictor-corrector is proposed.With a few iterations,the fuel consumption is near optimalwith the thrust magnitude and continuity constraint.Then,a horizon collision avoidance method based on collision-avoidance-time and optimized thrust distribution law is proposed.On this basis,a collision avoidance method meeting theglide-slope constraint is given by using coordinate rotation,which significantly improves the collision avoidance capabilityand the landing site visibility.After that,the uniform rotation guidance and the integrated guidance parameter planningmethod based on predictor-corrector is proposed,so that the guidance terminal states meet the acceleration constraint.Finally,the mathematical simulation shows that the new method is effective,has strong adaptability to multiple constraints,and requires relatively little computation,which is suitable for engineering applications.Key words:Planetary landing;Powered descent;Optimal feedback guidance;E-guidance;ZEM/ZEV0引言未来行星着陆探测任务普遍提出定点着陆的工收稿日期:2 0 2 3-0 1-15;修回日期:2 0 2 3-0 4-18基金项目:国家自然科学基金(6 16 7 30 57,6 152 530 1)文献标识码:APlanetary Powered Descent文章编号:10 0 0-132 8(2 0 2 3)0 8-117 1-12程目标,一般要求落点精度为10 0 m。实现此目标主要依靠动力制导。以往月球和火星着陆器的动力制导方法研究和工程应用多采用多项式制导,例如1172阿波罗制导和E制导。阿波罗制导的优点是终端三维位置、速度和加速度全部受控,缺点是固定终端时刻后未对推进剂消耗作优化。Lu1-2为改进阿波罗制导,先是参考隐式制导在原制导律中增加了一个控制增益作为可调参数,之后应用分数多项式理论又增加了分数指数参数,并将新方法命名为分数多项式动力下降制导。阿波罗制导中发动机推力加速度为时间的二次多项式形式。经典的E制导及与其等同的基本型ZEM/ZEV制导3的推力加速度的制导指令为时间的一次多项式形式。E制导已被证明是常值引力场假设下的固定终端时刻的加速度模平方积分最优制导4,即能量最优制导,虽然不能完全等同于推进剂消耗最优,但是已经对推进剂消耗做了显著优化。E制导的一项缺点是终端三维加速度不完全受控。E制导和阿波罗制导都未考虑推力范围限制,因此实际应用中指令推力可能触发推力饱和。E制导或基本型ZEM/ZEV制导尽管是最优反馈制导,但是面对实际工程应用时还是存在一些不足,因此对其改进的方法不断被提出。这些改进包括完善最优制导时长确定方法,提高制导算法的鲁棒性和碰撞规避能力等。Guo等5 使用数值优化程序CPOPS选择中间航路点作为ZEM/ZEV制导的中间目标,实现了火星动力下降约束下滑角的碰撞规避。Zhou等6 针对火星动力下降段制导规避碰撞地平问题,在ZEM/ZEV制导原性能指标中添加了加权的高度项,然后推导出有地平碰撞规避能力的改进制导律。Wiben等7 为了提高ZEM/ZEV制导在火星动力下降段的干扰适应性,加人最优滑动制导并证明了新方法的全局稳定性。Zhang 等8 利用平均加速度修正基本型ZEM/ZEV制导加速度的来解决月面着陆地平碰撞规避问题,还应用模型预测静态规划(MPSP)方法迭代计算满足终端状态约束的解。Zhang等9 对Zhou等6 的方法继续改进,将性能指标中高度项的常值加权系数改为与高度平方相关的时变系数,进一步提升碰撞规避能力。Ahn等10 研究了轨道拦截或交会机动问题的由最小能量和最小时间组成的性能指标,利用最优控制理论和横截条件,推导出确定ZEM/ZEV制导最优制导时长的代数方程。Wang等提出一种适用于火星精确着陆的两段ZEM/ZEV反馈制导方法,通宇航学报过虚拟终端速度和在线参数搜索来提高制导的障碍规避能力。高峰等12 利用脉宽脉频(PWPF)调制器将ZEM/ZEV制导的连续指令转换为常值推力器的开关指令。碰撞规避是行星着陆制导必须具备的能力。除了上面提到方法外,还有一种解决思路是控制着陆轨迹的曲率。Cui等13先是提出了一种基于多项式的曲率制导策略,通过调整曲率使着陆器沿凸形轨迹着陆,降低障碍物碰撞的风险。之后进一步改进,将曲率约束凸化为二阶锥约束,并利用非线性规划工具求解凸规划问题来优化推进剂消耗14近年来数值优化方法和人工智能技术被越来越多的应用于行星着陆制导问题的理论研究中。林晓辉等15应用凸优化理论将月球动力下降段轨道优化问题转化为二阶锥问题,并采用内点法求解了最优标称轨迹。邓雁鹏等16 应用序列凸优化方法解决月面动力下降过程中时变加速度剖面实时估计和补偿问题。Furfaro等17 将深度强化学习方法与ZEM/ZEV制导方法相结合,通过动态调节2 个制导增益和制导时长来满足行星着陆问题的路径等约束并优化推进剂消耗。数值优化制导计算量大,依赖高效稳定的求解器。人工智能制导目前处于理论研究阶段,工程应用同样面临计算量大和算法稳定性方面的挑战。总体而言,传统最优反馈制导方法有着计算量小、稳定性好、节省推进剂的优势,但是仅满足初始和终端位置速度约束。实际工程应用中还需要考虑推力范围受限、连续变推力、碰撞规避和终端加速度等多方面约束。单台变推力发动机推力的大小和方向在物理上只能连续变化,因此要求制导的指令推力连续变化。着陆终端希望着陆器为竖直姿态,并且合加速度接近为零,这就对制导的终端加速度提出了约束。现有最优反馈制导方法研究欠缺对上述约束的综合考虑。本文考虑推力范围受限、连续变推力、碰撞规避和终端加速度共4方面约束,对动力下降应用的传统最优反馈制导方法进行改进和完善。内容安排为,首先建立行星定点着陆动力下降制导问题模型,然后介绍和分析E制导和阿波罗制导方法,接着详细阐述提出的多约束最优反馈制导方法,最后通过数学仿真验证所提方法有效性。第44卷第8 期1问题模型1.1制导坐标系定义制导坐标系原点0 定义在目标着陆点,从原点指向天向定义为Z轴,垂直Z轴从原点指向着陆器初始位置方向为X轴,Y轴按照右手螺旋法则确定。在该坐标系下,XOZ平面即为理想着陆轨迹面,或又称为纵向平面,Y轴即为轨迹面负法线方向。X轴位移体现着陆器航程变化,因此可以将X向称之为航向,Z轴位移体现着陆器高度变化,Y轴位移体现着陆器垂直轨迹面位置变化,因此可以将Y向称之为横向。1.2行星动力下降动力学方程月球没有大气。火星大气稀薄,在着陆器动力下降段气动力显著小于制导推力。因此以往分析行星动力下降制导问题时忽略大气影响,仅考虑中心天体引力和发动机推力。制导坐标系下的行星动力下降动力学方程如下:i=Vi=g+aa=F/mm=-F/IspS式中:r和v分别为着陆器实时位置矢量和速度矢量;8 为行星作用于着陆器的引力加速度矢量,在常值引力场假设下其分量形式写为 0 g;为制导推力加速度矢量;F为制导推力矢量,F=IlFl;m 为着陆器实时质量;Isp为制导发动机比冲。1.3定点着陆制导问题定点着陆制导问题即控制着陆器以指定终端速度到达指定终端位置。研究定点着陆制导问题时一般将终端位置和速度取为零。定点着陆制导问题属于轨迹优化问题,轨迹优化问题又属于最优控制问题。设初始时刻为0,下面依次列出定点着陆制导问题的初始条件、终端条件、性能指标和推力约束表述。初始条件:m(0)=mo终端条件:张晓文等:行星动力下降多约束最优反馈制导方法(1)(2)(3)(4)r(0)=ro(5)v(0)=Vo(6)(7)1173r(tt)=r(8)v(t)=Vf(9)性能指标:fFdt0sp推力约束:FminFFmmax式中:r。和vo分别为着陆器初始位置矢量和速度矢量,其分量形式为ror,T 和oU,omo为着陆器初始质量;r和V分别为着陆器终端目标位置矢量和速度矢量,其分量形式为rxtryr.rT和uUrT;t r 为制导的终端时刻,在初始时刻设为0 时,又称为制导剩余时长,或简称制导时长。Fmin和Fmax分别为发动机允许的推力最小值和最大值。此外,记推力加速度矢量的分量形式为,;初始推力加速度矢量为,其分量形式为o,o;记终端推力加速度矢量为ar,其分量形式为aa,a.。2多项式制导多项式制导即制导指令加速度为时间的多项式形式。常见的多项式制导有E制导和阿波罗制导。下面对E制导和阿波罗制导展开原理介绍和性质分析。在做性质分析时假设引力加速度为常值。2.1 E制导在E制导方法中,制导推力加速度三维矢量取为时间的一次多项式,包含2 个待确定系数矢量,即指令推力加速度为a=co+cit,teo,tr将式(12)代人动力学方程(2)中,然后连续积分两次,并代入位置速度的初值和终值确定制导律系数,结果如下:2(V,-V。Cogtft6C1将式(13)代人式(12)中后,得到E制导的初始时刻推力加速度计算公式:(10)(11)(12)6r-ro-Votr-g 2)十12(r-ro-Votr)(14)t(13)1174ao=-g-t定义零控位移偏差rzem和零控速度偏差Ve如下:rmr,-ro-tro-2gi1Vzev Vr-Vo-tig代入式(15)中,得到零控位移偏差rzem和零控速度偏差vzev形式的制导指令推力加速度计算公式,即基本型ZEM/ZEV制导律公式:62aoVzemzevt上式说明E制导与基本型ZEM/ZEV制导完全相同。将零控位移偏差rzem和零控速度偏差Vzev前的常值控制增益6 和-2 改为可调控制增益k,和kv,则得到了一般型的ZEM/ZEV制导律公式18:k(19)ao=+Vey27zem利用庞特里亚金极小值原理可以证明,E制导是常值引力场假设下的加速度模平方积分最优制导,即能量最优制导,使得如下性能指标最小:(20)0E制导性质1.E制导的单个方向推力加速度为单调变化。对式(12)求导得结果为常数,证明了E制导性质1。以垂向为例,当初始垂向速度和位置ro满足关系 a-2ra时,i.0,即垂向推力加速度t单调增加。若垂向推力加速度在初始和终端非负,则垂向推力加速度全程非负。E制导性质2.设r=0和v=0,满足aTadt最小的为如下的一元四次方程的正实数解-36 rfr。-2 4r v o t -4v i v o t +g g t =0E制导性质3.已知初始高度大于零,即ro0,在tE0,t),满足r,0 的条件为3r.0t-宇航学报22.2阝阿波罗制导(rr-ro-Vott)在阿波罗制导方法中,制导加速度三维矢量取(15)为时间的二次多项式,包含3个待确定系数矢量,即指令推力加速度为a=Co+Cit+ct,te0,t将式(2 3)代人动力学方程(2)中,然后连续积(16)分两次,并代入位置、速度和加速度的初值和终值确(17)定制导律系数,结果如下:12Co48C1(18)C将式(2 4)代人式(2 3)中后,得到E制导的初始时刻推力加速度计算公式:k6ao=artt由阿波罗制导的求解过程可知,求解常值制导参数时用到了终端位置、速度和加速度条件,,因此与tfE制导相比,阿波罗制导除了可以满足终端位置和aadt速度约束外,还可以满足终端加速度约束。3多约束最优反馈制导3.1制制导时长寻优算法多约束最优反馈制导的基础是E制导,也即基本型ZEM/ZEV制导。E制导给出了终端时刻固定的指令加速度计算公式,没有给出终端时刻的确定方法。如果制导加速度允许范围不受约束,则E制导的终端时刻可由E制导性质2,即式(2 1)确定,保tf证了制导加速度模平方的积分最小。工程应用中制导加速度允许范围一定受限。一般来讲,制导时长0越短越节省推进剂6,但是推力变化范围也会随之变大,最终指令推力超过了发动机实际允许范围,即指令推力饱和。考虑推力范围约束后,实际输出推(21)力矢量满足如下公式:F=max(min(mllall,Fmax),Fminmin(22)E制导有解析的轨迹预报公式,理论上只要终第44卷(23).)-%(v+v.)+a,(24)r6(5V+3vo)+3612(2Vtf-ro-Vott)(27)aIlall(28)6aft(25)6+2af(26)t第8 期端指令推力不饱和,则规划轨迹满足终端状态约束。因此,将终端指令推力不饱和作为制导算法基本原则。在此基础上尽量缩短制导时长作为优化推进剂消耗的方向。最优制导时长参数难以通过解析计算公式直接获得,因此这里采用数值方法来寻找。优化制导时长首先需要给出其一个合理的初值tro。该初值应尽量接近最优值又要便于计算。这里提出将使得初始指令推力正好等于允许最大推力的制导时长作为优化初值to。设r=0和V=0,由式(15)推导得到E制导的推力加速度模平方的初值为36TTaoao4roro120g由最大允许推力Fmax和初始质量m。得到最大允许初始加速度为omax=Fmax/mo。将最大允许初始加速度omax代人式(2 9)得到制导时长t的4次方程:(am-gng)t-8vigti-(16vivo+12rig)t-48ravo tr-36rfro=0(30)利用解析公式求解该方程,将其中最大实数根作为制导时长初值tro。将制导时长初值tro代入E制导公式,进行首次数值积分预报,得到终端时刻标称推力指令。如果终端指令推力饱和,则需要增加制导时长。这里采用预测校正方法来计算增加量。记数值积分预报给出的指令推力在制导末端持续饱和的时长为tts,校正系数记为ka,则给出制导时长第1个校正公式如下:t,i+1=tr.,;+k,tfs式中:下标i为迭代计算拍数。将校正后制导时长再次代人制导方程,重新进行数值积分预报。当终端指令推力不再饱和时认为制导时长优化完成。如果首次数值积分预报的终端指令推力未饱和,则说明制导时长还可以缩短。记制导时长缩短系数为k。,则制导时长缩短公式如下:tr,i+1=k,tr.i应保证制导时长缩短足够充分,使得终端指令推力一定饱和。接下来再次进行数值积分预报。仍然采用预测校正方法来计算增加量。记校正系数为kp,则给出张晓文等:行星动力下降多约束最优反馈制导方法16.,T48.Tg+orovo+T+g十8Vogt1175制导时长第2 个校正公式如下:tf,i+1=tr.i+ki,ts校正系数k.和k,取值偏小的话,则单次修正量过小,需要的迭代计算次数多。校正系数取值偏大的话,则单次修正量过大,计算得到制导时长比其最优值偏大较多。定义推力俯仰角为推力方向和天向的夹角。为避免着陆器大幅度姿态机动带来多方面不利影响需要约束推力俯仰角。通常不希望推力俯仰角超过90,对应的等效条件是垂向推力加速度非负。由垂向推力加速度非负得到的制导时长的不等式约束为:-2 00-/4 0%-6 g r.0t(29)显然该式给出了一个制导时长的最小值约束。3.2石碰撞规避算法碰撞地面风险规避要求飞行高度不低于地面。由E制导性质3得到制导时长需满足不等式(2 2),因此定义碰撞规避时长如下3T.0teolLo,式中:Umin为足够小的速度阈值,避免除零。为规避碰撞地平风险,计算垂向制导加速度时,制导时长计算公式如下:teol,tr teol 0t=t,其它依据上式得到新的制导加速度,进行数值积分预报,如果推力没有饱和,那么用上式方式来制导可以实现临界碰撞规避。但是实际推力很可能初始就饱(31)和,且上式取值临界,此时碰撞规避就很可能已经来不及。这种情况下需要进一步优化推力加速度的分配。由于碰撞规避的优先级高,因此推力饱和时,优先满足垂向的推力加速度需求。给出碰撞规避控制的推力优化分配律如下:m0 0 amx T,mkya,kya,a,T,a,VaminIloll Umina,amaxlall amaxIlallamax22amaxkxy(35)(36)(37)(38)+a22a1176式中:m为着陆器当前质量;amx为当前最大允许推力加速度;xv,和.为加速度优化分配前指令加速度三轴分量,且,0;F为优化分配后的指令推力矢量。为了进一步提高着陆安全性,增加碰撞规避的裕度,可以再增加下滑角约束,即着陆器与目标着陆点连线,与地平的夹角需大于阈值。在满足地平碰撞规避的基础上,下滑角约束通过坐标系旋转的方法即可方便的得到满足。记下滑角阈值为,则由制导坐标系到下滑角坐标系的旋转阵为 cos()0sin()Cgl=0L-sin()0(将初始位置矢量r。和速度矢量vo,终端目标位置量r和速度矢量V,引力加速度矢量g,都左乘坐标系旋转阵Cl,得到下滑角坐标系对应的分量。将经坐标系旋转变换后的变量作为新的初始约束、终端约束和引力加速度矢量代入制导计算公式便可得到满足下滑角约束的解。满足下滑角约束后既提高了碰撞规避能力又增加了着陆点可见性。3.3匀速转动制导着陆终端一般希望着陆器为竖直姿态并且合加速度近似为零,即推力加速度应为负的引力加速度。这就对制导的终端加速度提出了约束。但是如前所述,E制导的终端三维加速度不完全受控,即不能满足该约束。为了满足终端加速度约束,在E制导结束之后,引人匀速转动制导,迅速调整推力加速度到目标值。匀速转动制导的功能是依据最大角速度和最大推力变化率约束实现最短时间内调整推力加速度矢量的方向和大小。匀速转动制导的指令推力在由初始和终端加速度确定的平面内匀速转动。匀速转动制导的输人为初始制导加速度。和终端目标加速度at,输出为指令推力F、制导时长t、位置增量r 和速度增量v。初始制导加速度。和终端目标加速度的夹角为:0,=arccosTao Ila,T记最大角速度为max和最大推力变化率为F,则匀速转动制导的制导时长t计算公式为:宇航学报定义匀速转动制导的平面坐标系为:原点为推力作用点,X轴为初始制导加速度方向,X轴向终端目标加速度方向旋转90 得到Y轴。匀速转动制导的原理是首先计算平面坐标系下推力加速度矢量,然后将其转换为三维坐标系下矢量。最终的匀速转动制导的指令推力计算公式为:(F,-Fo)t1 cos(0)F=MFo+-J sin(0)F。=mo l l a o l l10cos()Jaar第44卷r_ mo I Ila,ll-Ila。l It=max(Wmax,(39)Ff=m lla,lI0=9it/t式中:M为将平面坐标系矢量转为三维坐标系矢量的转换阵;m为着陆器在制导终端的质量,可以用初始质量m。近似代替。对合加速度做一次和二次积分分别得到位置增量r和速度增量v的解析表达式:tfAv=(g+a)dt0tftAr=/(g+a)dsdt利用位置增量r和速度增量v的解析表达式可以快捷的预报制导终端状态。最优反馈制导和匀速转动制导拼接组合的状态和参数相互耦合和影响,无法独立确定。这里采用预测校正方法实现组合制导参数的规划计算,示意见图1。首先仅考虑初始和终端位置速度约束计算最优反馈制导参数和结果,并将其终端位置速度加速度记为交接位置r、交接速度vm和交接加速度am;然后将rmVm和am作为初值代入匀速转动制导,获取位置增量r和速度增量,以及终端位置速度预测r和;之后利用Ar和v修正rm和vm,即两种制导方法交接处的位置速度,重新计算最优反馈制导参数和结果;然后再重新计算匀速转动制导终端状态;当终端位置和速度偏差足够小时结束迭代。最优反馈制导和匀速转动制导交接处的位置(40)r和速度vm的校正公式如下:rm=rf-rVm=Vf-AV(41)Fmax(42)(43)(44)(45)(46)(47)(48)(49)第8 期mv.和a由式(42)等做匀速转弯制导计算和终端位置和速度偏差足够小?是结束图1组合制导参数预测校正规划方法示意Fig.1 Diagram of predictor-corrector planning method forintegrated guidance parameters4仿真校验以火星探测任务的动力下降段为例,通过数学仿真方法来验证和分析新提出的制导方法。仿真用例选取时参考了文献5,7,9,11中的共同用例。着陆器的初始质量取为19 0 5kg,发动机比冲取为2205Ns/kg,制导坐标系下的初始位置为2 0 0 0,0,1500m,初始速度的多组工况在后面分别给出;目标终端位置为0,0,0 m,目标终端速度为0,0,0Tm/s,目标终端加速度为0,0,0 m/s。发动机推力最大值为13.2 58 kN,最小值为4.9 7 1kN。火星引力加速度取为0,0,-3.7 114Tm/s。校正系数k.和ks的取值分别为0.7 和0.3。制导时长缩短系数k取为0.5。4.1有效性验证设计制导有效性验证仿真工况对3.1节中方法做验证,设定了4组初始速度取值,详见表1。表1有效性验证仿真工况的初始速度Table 1 Initial velocities of effectiveness verificationsimulation cases工况初始速度/(m s-1)10,0,-752-50,0,-75325,0,-75425,25,75张晓文等:行星动力下降多约束最优反馈制导方法开始.和。由式(15)等做最优反馈制导计算1177有效性验证仿真工况的轨迹见图2。从图中可知,4条轨迹的初始位置相同,由于初始速度不同导致中途轨迹不同,不过最终都汇集到了坐标系原点,由式(48)和(49)校正和vmAr和AV否即目标终端位置。比较工况2 到3的制导飞行轨迹,当航向初始速度为负值时,制导飞行轨迹偏左上,航向初始速度为正值时,制导飞行轨迹偏右下。比较工况3和4的制导飞行轨迹,当垂向和航向初始速度相同,有横向初始速度时,制导飞行轨迹将偏右下。有效性验证仿真工况4的横向位置速度曲线见图3。从中可知,横向位置偏差先增大然后逐渐减小到零,横向速度偏差先由正值变为负值然后逐渐减小到零。有效性验证仿真工况的推力比见图4。从中可知,初始航向和横向速度越大则制导时长越长,初始推力饱和时长也越长。工况1、3和4的推力由饱和段、减小段和增加段组成,即推力大致按照大小大的趋势变化,近似于最优控制理论给出的变推力制导的最大最小最大推力剖面19。工况2虽然没有推力饱和段,但是推力符合大、小、大的变化趋势。有效性验证仿真工况的推力俯仰角见图5。从图中可发现推力俯仰角的2 个变化规律。第1个规律是推力俯仰角先大后小然后再增大,原因是着陆器为了实现水平方向的位移,需要在水平方向上先加速然后再减速。第2 个规律是初始航向和横向速度越大则初始推力俯仰角越大,原因是制导需要在水平方向分配更多的推力来抵消初始的反向水平速度。150010005000200400600800100012001400160018002000X向位置/m图2 有效性验证仿真工况的轨迹Fig.2 Trajectories of effectiveness verificationsimulation cases制导有效性验证仿真工况的制导时长和推进剂消耗仿真结果见表2。从表中可知,初始航向和横向速度越大则制导时长和推进剂消耗越长和越多。工况工况2工况3工况41178250200/150100500图3有效性验证仿真工况4的横向位置速度Fig.3Cross position and velocity of effectivenessverification simulation case 41.000.950.900.850.800.750.70F0.650图4有效性验证仿真工况的推力比Fig.4Thrust throttles of effectiveness verificationsimulation cases806040()/200F-20-400图5有效性验证仿真工况的推力俯仰角Fig.5 Thrust pitch angles of effectiveness verificationsimulation cases工况2 由于初始航向速度与目标水平移动方向相同,因而制导时长最短并且推进剂消耗最少。表中宇航学报25给出了预测校正法和遍历法两种方法的推进剂消耗横向位置来对比。遍历法的搜索步长取为1 s。可以看出,预一横向速度2015(r-s.)/率回1050-5-101020时间/s工况1工况2工况3工况410201020第44卷测校正法的推进剂消耗十分接近遍历法,最大仅相差1.1%。表中还给出了两种预测校正的实际迭代次数。工况1实际执行式(31)所示的预测校正0次,执行式(33)所示的预测校正2 次。工况2 实际执行式(31)所示的预测校正1次,执行式(33)所示的预测校正0 次。所有4个工况仅需执行1到2 次预测校正便可获得满意的结果,说明所提出的预测30403040时间/s30时间/s5050工况1工况2工况3工况44050606060校正方法不仅有效而且高效。表2 有效性验证仿真工况的制导时长和推进剂消耗Table 2 Time-to-go and fuel consumption of effectivenessverification simulation cases预测校正法的预测校正法的工况制导时长/s推进剂消耗/kg进剂消耗/kg选代次数145.7240.2349.7451.54.2碰撞规避验证文献5,9,11中为了测试验证制导算法碰撞规避性能,设计了恶劣的碰撞规避仿真工况,初始速度取为10 0,0,7 5Tm/s。在此初始速度条件下,分别按照无碰撞规避、有地平规避、有8 下滑角约束和有9下滑角约束进行制导方法的测试仿真,对比验证3.2 节中的碰撞规避方法。碰撞规避仿真工况的轨迹见图6。从中可知,无碰撞规避的制导飞行轨迹有部分位于了地平线下,该结果意味着着陆器将与地面碰撞。考虑地平规避的制导飞行轨迹在着陆后期紧紧贴着地平,实现了临界的碰撞规避,该结果具有理论分析意义,但是不能用于实际飞行,因为其安全裕度不够高,实际地面必然是具有一定幅度的起伏。有8 和9下滑角约束的着陆轨迹可以明显看到着陆后期保持了一定的飞行高度,与地平线形成了固定夹角,显然该飞行轨迹的碰撞规避裕度更高,对一定幅度的地形突起也可以实现碰撞规避,因而更具有工程应用价值。工况2 到4的高度是单调变化的,另外着陆后期的轨迹线为直线,原因是着陆后期在下滑角坐标系下垂向速度已被控制到零。文献5利用航路点方法作碰撞规避的后期航迹也近似直线,然而航路点前后制导推力不连续。文献9,11中碰撞规避段的高度是先探底然后上升之后再下降,也就是高度非单调下降,并且文献遍历法的推预测校正232.6231.8199.8197.7257.6257.1262.3261.40,21,00,10,1第8 期11中也有制导推力跃变点。碰撞规避仿真工况的垂向速度见图7,从中可知,工况1的垂向速度先为负值后为正值,工况2 和3的垂向速度全程为非正值,工况4的垂向速度先为负值中间为正值后为负值。工况4的垂向速度出现正值的原因是在碰撞规避控制段的推力始终饱和。碰撞规避仿真工况的推力比曲线见图8,从中可知,全部工况的推力由饱和段、减小段和增加段组成,即推力大致按照大小大的趋势变化。比较工况2 到4可知,碰撞规避的约束下滑角越大,制导时长越长。另外,考虑碰撞规避后制导初期的推力饱和段时长增大,并且碰撞规避裕度越大,制导初期推力饱和段时长增大的越多。碰撞规避仿真工况的推力俯仰角见图9,从中可知,碰撞规避要求越严格则推力的初始俯仰角越小,如果初始推力饱和则初始俯仰角等于负的下滑角。该现象的原因是,为了实现碰撞规避就需要减小下降速度,因此制导算法在垂向分配的推力更大,因此推力俯仰角就会相对变小。工况4的推力俯仰角在30s时发生3.1的跃变,原因是碰撞规避控制结束时刻已到,但是推力还处于饱和状态,因此导致制导加速度变化不连续。工况4说明如果希望制导推力连续,则在碰撞规避控制结束时制导推力应处于非饱和状态。工况3在保证指令推力连续的前提下满足了8 下滑角约束,大于文献5,11中相同条件下实现的42000150010005000-500-1000EFig.6Trajectories of collision avoidance simulation cases碰撞规避仿真工况的制导时长和推进剂消耗见表3。从中可知,有地平规避与无碰撞规避相比制导时长减少3.2 s推进剂消耗增加6.5kg,有8 下滑角约束与无碰撞规避相比制导时长增加0.7 s推张晓文等:行星动力下降多约束最优反馈制导方法30405060708090100时间/s图7碰撞规避仿真工况的垂向速度Fig.7Vertical velocities of collision avoidance simulation cases1.00.90.80.70.60.50.40102030 4050 60708090100时间/s图:碰撞规避仿真工况的推力比Fig.8 Thrust throttles of collision avoidance simulation cases无规避80地平规避8下滑角9下滑角5001000150020002500300035004000航向位置/m图6 碰撞规避仿真工况的轨迹117920100(r-s.)/率(回垂-10-20-30-40-50-60-70-8001020无规避地平规避8下滑角9下滑角-706040-74200-20-40-60-80010 2030 405060 708090100时间/s图9 石碰撞规避仿真工况的推力俯仰角Fig.9 Thrust pitch angles of collision avoidance simulation cases进剂消耗增加18.3kg,有9下滑角约束与无碰撞规避相比制导时长增加13.9 s推进剂消耗增加75.6kg。本节仿真结果说明新制导方法的碰撞规避策略有效,并且满足碰撞规避要求后付出的推进无规避地平规避8下滑角9下滑角安-7 2293031时间/s无规避地平规避8下滑角?9下滑角01180剂代价相对小。表3碰撞规避仿真工况的制导时长和推进剂消耗Table 3 Time-to-go and fuel consumptions of collisionavoidance simulation cases序号工况1无碰撞规避2地平规避38下滑角约束78.949下滑角约束92.14.3有终端加速度约束设计有终端加速度约束仿真工况来验证3.3节中方法,初始速度取为0,0,-7 5Tm/s,目标终端加速度为0,0,0 m/s。姿态机动最大角速度和最大推力变化率取值见表4。预测校正迭代计算的终止条件为终端位置偏差小于1m,速度偏差小于0.1 m/s。表4有终端加速度约束仿真工况的最大角速度和最大推力变化率Table 4 Maximum angular rate and maximum thrust changerate of terminal acceleration constrained simulation cases序号最大角速度/()s-)最大推力变化率/(Ns-I)110220330有终端加速度约束仿真工况的轨迹见图10,从中可知,着陆前中期3条轨迹基本重合,着陆后期3条轨迹略有差异,终端时刻3条轨迹都满足了终端位置约束。有终端加速度约束仿真工况的推力比见图11,以工况1为例,前40.2 s为最优反馈制导,之后为匀速转动制导,推力比从0.95降至0.47。有终端加速度约束仿真工况的俯仰角见图12,以工况1为例,在40.2 s处可以清楚的看到俯仰角发生转折,这是因为制导律切换为了匀速转动制导,俯仰角迅速从54.7 转动到0。推力比和俯仰角的仿真结果表明制导终端状态满足了终端加速度约束。有终端加速度约束仿真工况的数值结果见表5。从表中可知,虽然匀速转动制导时长随着最大角速度和最大推力变化率增大而减小,但是总制导时长并没有出现等幅度变化,而是变化很小。匀速转动制导时长越短则推进剂消耗越少。工况1的推进剂消耗最多,与4.1