温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
全球
AIS
航迹
关联
数据
崔亚奇
基于全球AIS的多源航迹关联数据集崔亚奇徐平亮*龚诚余舟川张建廷于洪波董凯(海军航空大学信息融合研究所烟台264001)(91001部队北京100000)(91977部队北京100000)摘要:数据、算法和算力是当前人工智能技术发展的3大推力,考虑到智能关联算法研究的迫切需求和多雷达协同观测航迹数据获取困难,针对航迹关联数据集缺失问题,该文公开了多源航迹关联数据集(MTAD),其由全球AIS航迹数据经栅格划分、自动中断和噪声添加处理步骤构建。该数据集包括训练集和测试集两大部分,共有航迹百万余条,其中训练集包含5000个场景样本,测试集包含1000个场景样本,每一个场景样本由几个到几百个数量不等的航迹构成,涵盖多种运动模式、多种目标类型和长度不等的持续时间。同时,进一步对构造的MTAD数据集进行可视化分析,详细研究了各个栅格内航迹的特点,证明了该数据集的丰富性、合理性和有效性。最后,作为参考,给出了关联评价指标和关联基线结果。该数据集目前已被用作海军“金海豚”杯竞赛科目专用数据集。关键词:航迹关联;自动识别系统(AIS);人工智能;深度学习中图分类号:TN957.52文献标识码:A文章编号:1009-5896(2023)02-0746-11DOI:10.11999/JEIT221202Multisource Track Association Dataset Based on the Global AISCUIYaqiXUPingliangGONGChengYUZhouchuanZHANGJiantingYUHongboDONGKai(Institute of Information Fusion,Naval Aviation University,Yantai 264001,China)(91001 Unit,Beijing 100000,China)(91977 Unit,Beijing 100000,China)Abstract:Data,algorithms,andhashratesarethethreethrustforcesfordevelopingartificialintelligence.Consideringtheurgentdemandforresearchontheintelligentassociationalgorithmandthedifficultyofobtainingtrackdatafrommulti-radarcollaborativeobservationandaddressingtheproblemofmissingtrackassociationdataset,aMulti-sourceTrackAssociationDataset(MTAD)isconstructedinthisstudy.MTADisbasedonautomaticidentificationsystemtrajectorydataafterprocessinggriddivision,automaticinterruption,anderroradding.Thedatasetincludestwoparts,namely,thetrainingdatasetandthetestdataset,withmorethan1milliontracks.Thetrainandtestdatasetscontain5000and1000scenesamples,respectively.Eachscenesampleconsistsofseveraltohundredsoftracks,coveringvariousmovementpatterns,targettypes,anddurationtimes.Inaddition,theconstructedMTADisfurthervisualizedandanalyzed,andthecharacteristicsoftracksineachgridarestudiedindetail,demonstratingtherichness,rationality,andeffectivenessoftheMTAD.Theindicatorsandbaselineresultsoftheassociationareobtained.ThisdatasethasalreadybeenusedasadedicateddatasetfortheNavys“GoldenDolphin”Cupcompetition.Key words:Trackassociation;AutomaticIdentificationSystem(AIS);Artificialintelligence;Deeplearning收稿日期:2022-09-15;改回日期:2022-10-30;网络出版:2022-11-03*通信作者:徐平亮xu_基金项目:国家自然科学基金(61790554,62001499,62171453)FoundationItems:TheNationalNaturalScienceFoundationofChina(61790554,62001499,62171453)第45卷第2期电子与信息学报Vol.45No.22023年2月JournalofElectronics&InformationTechnologyFeb.20231 引言多源航迹关联问题在雷达数据处理领域中普遍存在,其中也包含中断航迹接续关联问题,并且有着较长的研究历史,是目标跟踪1、态势感知2、信息融合3的前提和基础。中断航迹可以表述为:在对目标进行跟踪的过程中,受目标机动、平台机动、长采样间隔、低探测概率等多种因素影响,存在大量的航迹中断现象,即目标的当前航迹突然消失,一段时间后又在临近区域重新起始跟踪一条新的航迹。多源航迹可以表述为:在对目标进行跟踪的过程中,经过不同传感器的观测,上报了对同一目标的多个航迹,各个航迹包含不同的系统误差和随机误差。对于这两种航迹关联问题,传统方法需要预先假定目标的运动模型,利用目标的先验信息,采用统计估计理论对待关联航迹进行复杂计算完成关联任务48,存在假设不合理、先验信息难以获取、门限无法确定等问题。近年来,随着人工智能和深度学习技术的快速发展,有学者提出采用基于深度学习的数据驱动方法完成航迹关联任务,利用神经网络提取航迹的运动特征、中断特征、多源误差特征等信息,通过损失函数对高维空间中的航迹特征进行约束,实现从航迹数据到关联结果的映射911。与传统方法相比,深度学习方法可以基于实测航迹数据,自动训练航迹关联模型,有效避免了人工对模型的选取、目标运动参数的设置、目标先验信息的采集分析等大量调试操作,具有关联速度快、关联精度高、泛化能力强等优点。然而,采用深度学习方法实现航迹关联任务,其网络训练必须依赖大量的航迹数据。以上研究均基于仿真数据或采集到的少量真实数据,缺乏一个统一的、规范的、规模大的航迹关联数据集。在深度学习发展较为成熟的领域,均有相关的高质量数据集作为支撑,例如图像分类中的ImageNet数据集12、目标检测和分割的PASCAL-VOC数据集13和COCO数据集14、遥感图像分类的AID数据集15、遥感图像检索的RSICD数据集16、自动驾驶的KITTI数据集17、各类医学影像数据集1820,等等。可以说,在深度学习领域,数据逐渐达到了与模型和算法同等重要的程度,必须有统一的、规范的、规模大的高质量数据集,才能为某一相关研究的发展提供基本保障。但是,航迹关联数据集在国内外的构建还是一个空白,航迹关联数据集的缺失成为制约基于数据驱动的航迹关联研究的主要因素。因此,构建一个与航迹关联任务相适应的数据集对相关研究的发展具有重要意义。考虑到智能关联算法研究的迫切需求和多雷达协同观测航迹数据获取困难,针对航迹关联数据集缺失问题,该文公开了多源航迹关联数据集(Multi-sourceTrackAssociationDataset,MTAD),其由全球自动识别系统(AutomaticIdentificationSys-tem,AIS)航迹数据经栅格划分、自动中断和噪声添加处理步骤构建。该数据集包括训练集和测试集两大部分,共有航迹百万余条,其中训练集包含5000个场景样本,测试集包含1000个场景样本,每一个场景样本由几个到几百个数量不等的航迹构成,涵盖多种运动模式、多种目标类型和长度不等的持续时间。同时,进一步对构造的MTAD数据集进行可视化分析,详细研究了各个栅格内航迹的特点,证明了该数据集的丰富性、合理性和有效性。最后,作为参考,给出了关联评价指标和关联基线结果。2 数据集构建船舶自动识别系统是一种广播式的舰载应答系统,该系统能够使船舶在公用无线信道上向附近的船舶和岸上的监测部门持续发送自身的身份、位置、航向、航速等数据21。AIS系统具有定位精度高、船舶编码唯一、自控时分多址联接(SOTDMA)、电子海图等特点,为舰船目标识别22,23、舰船目标跟踪24,25、加强海事管理26,27等应用提供了可靠技术保障,在军用和民用领域均有广泛应用。由于其广播式的数据发送特点,与雷达航迹数据相比,AIS航迹数据具有分布广泛、获取难度低和时效性好的优点,因此这里采用全球AIS数据,构建多源航迹关联数据集。2.1 AIS数据特征信息MTAD数据集采用的基础AIS数据特征包括目标的用户识别码(MMSI码)、时间(UNIX时间戳,单位:s)、纬度(l/10000,90,北为+,南为)、经度(1/10000,180,东为+,西为)、航速(单位:kn)、航向(单位:()。利用以上基础特征通过添加中断和多源误差构造MTAD数据集。2.2 全球AIS可视化分析全球栅格是MTAD数据集构建的基础,数据集中的所有场景均从全球栅格中抽取产生,因此栅格中的航迹质量对于MTAD数据集的质量至关重要。为了分析全球栅格航迹信息,在全球地图中根据所有栅格中的MMSI数量绘制热力图,对MMSI数量进行可视化,结果如图1所示。从图1可以看出,在重要港口地带,MMSI数量较多,在远海区域,MMSI数量较少。各航迹在全球各个海域均广泛分布,为数据集的构建提供了丰富的航迹资源。之后,进一步分析MMSI数量的分布情况。以第2期崔亚奇等:基于全球AIS的多源航迹关联数据集747栅格内MMSI数量为横轴,栅格所占比例为纵轴,绘制柱状图,如图2所示。从图2(a)可以看出,全球绝大多数栅格中的MMSI数量在300个以下,但也存在一些栅格中的MMSI数量达到了2000个以上。为了更细致地分析MMSI数量在0300个的栅格比例,将MMSI数量在0-300个的栅格重新绘制其柱状图,如从图2(b)所示。图2(b)可以看出,在MMSI在0300个的各个分段均有栅格分布,全面的AIS航迹库为稀疏场景、普通场景、密集场景的构建提供了丰富的航迹资源。2.3 整体思路航迹关联数据集包括多个关联场景样本,每个关联样本包括信源航迹CSV文件和关联映射表CSV文件,信源航迹CSV文件包括两个信源的多条航迹,两个信源可设置为舰载雷达、机载雷达或岸基雷达等不同类型。关联样本生成流程如图3所示,包括参数设置、基于空间栅格的真值航迹抽取和信源航迹生成等3个步骤。2.4 参数设置参数设置包括场景设置、目标设置和信源设置。2.4.1 场景设置W0场景设置主要对栅格精度和场景中心经纬度进行设置。其中栅格精度,用于全球栅格划分,表示对全球经纬度划分的最小间隔;场景中心经纬度,用于后续空间栅格的平移。2.4.2 目标设置jNj0,1jMj0,1目标设置主要对目标密集程度和目标机动程度进行设置。其中目标密集程度反映栅格区域 内目标数量,取值范围;目标机动程度反映栅格区域 内目标运动变化程度,取值范围,它们的计算方法为jN=nj mininimaxini minini(1)jM=0.5jv miniivmaxiiv miniiv+0.5jc miniicmaxii