http://bhxb.buaa.edu.cnjbuaa@buaa.edu.cnDOI:10.13700/j.bh.1001-5965.2021.0557基于行人姿态的轨迹预测方法王瑞平1,宋晓2,*,陈凯3,龚开奇2,张峻凡4(1.北京航空航天大学自动化科学与电气工程学院,北京100191;2.北京航空航天大学网络空间安全学院,北京100191;3.南京航空航天大学机电学院,南京211106;4.北京航空航天大学宇航学院,北京100191)摘要:在自动驾驶领域,行人轨迹预测一直是研究热点之一,行人行为的不确定性给轨迹预测带来很大的挑战。目前大部分轨迹预测方法只专注于行人之间的信息交互,忽略了行人意图和场景中其他语义信息对行人轨迹的影响。为此,提出一种基于行人姿态的卷积编码器-解码器网络(PKCEDN)来预测目标行人轨迹的方法,所提方法包含基于卷积、长短时记忆(LSTM)网络的编码器-解码器模型和能够学习当前时刻与过去时刻轨迹相关性的注意力机制。所提方法在MOT16、MOT17和MOT20公开数据集上进行了相关测试,与Linear、LSTM、Social-LSTM、Social-生成对抗网络(GAN)、SR-LSTM和Msgtv等主流方法相比,在保证预测速度不降低的前提下,平均误差降低约36%。关键词:行人轨迹预测;姿态提取;编码器-解码器;注意力机制;空间语义信息中图分类号:V221+.3;TB553文献标志码:A文章编号:1001-5965(2023)07-1743-12无人自动驾驶正在大力发展,行人轨迹预测问题是其中重要的组成部分,如果能够提前准确地对行人轨迹进行预测,自动驾驶系统能够使车辆事先对行人的行为做出正确的决策,促进自动驾驶、无人车配送等领域的发展,具有很好的应用价值[1-3]。因此,在计算机视觉领域,轨迹预测[3]越来越成为研究者关注的研究方向。近些年,随着人工智能的发展,研究人员逐渐用神经网络[4-5]的方法预测行人轨迹,主要包括常规卷积网络和图卷积网络。这种预测一般是根据行人过去时刻的轨迹,结合周围环境对其的影响,预测行人未来时刻的行走轨迹。目前,该领域主要的关注点是如何充分利用丰富的视觉信息辅助行人轨迹的预测。行人轨迹是行人与周围环境综合交互的结果。行人未来轨迹主要取决于行人过去时刻的轨迹,与周围人和车等障碍物的交互,与周围自然环境的交互[6-8]。基于此,构建行人轨迹预测模型具有较高的挑战性。目前,行人轨迹预测方法主要考虑2个方面:①行人意图。现有的行人轨迹预测方法很少考虑行人的意图。在文献[6]中,将行人相关活动分为29种,并且将行人未来活动和轨迹预测结合起来。但行人的实际意图有很多...