温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
GPU
荧光
油膜
运动
路径
实时
测量
吴培灵
第 14 卷 第 1 期2023 年 2 月Vol.14 No.1Feb.2023航空工程进展ADVANCES IN AERONAUTICAL SCIENCE AND ENGINEERING基于 GPU的荧光油膜运动路径实时测量吴培灵1,张征宇1,2,孙维1(1.西南科技大学 信息工程学院,绵阳 621010)(2.中国空气动力研究与发展中心 高速空气动力研究所,绵阳 621010)摘要:在风洞试验中,现有的基于 CPU 的光流法求解荧光油膜运动速度场耗时过长,而基于 GPU 的光流法存在 GPU 资源利用不充分的问题。为此,提出基于荧光油膜图像分块和临界约束的 GPU 荧光油膜运动路径实时测量方法。将荧光油膜时序图像按照 GPU 的资源将整帧图像切割分块并行处理,创建其对应的光流并行计算策略,即充分利用 GPU 的并行流水架构优势和共享内存实现各并行块的光流计算的硬件加速;同时结合块间临界约束条件,以各块的速度矩阵迭代差为标志控制其迭代计算次数。结果表明:本文方法在保证荧光油膜运动速度场计算精度的条件下,较传统的基于 CPU 的光流法解算速度平均提升了 2 789.5倍,较整帧图像的GPU 光流法速度平均提升了 10.09倍,实时解算速度可达 90帧/秒。关键词:光流法;图像分块;临界约束;荧光油膜;共享内存中图分类号:V211.7 文献标识码:ADOI:10.16615/ki.1674-8190.2023.01.19Real-time measurement of fluorescent oil film motion path based on GPUWU Peiling1,ZHANG Zhengyu1,2,SUN Wei1(1.School of Information Engineering,Southwest University of Science and Technology,Mianyang 621010,China)(2.High Speed Aerodynamics Research Institute,China Aerodynamics Research and Development Center,Mianyang 621010,China)Abstract:In the wind tunnel experiment,the existing CPU-based optical flow method takes too long to solve the velocity field of the fluorescent oil film,while the GPU-based optical flow method has the problem of insufficient utilization of GPU resources.To this end,a real-time measurement method of GPU fluorescent oil film motion path based on fluorescent oil film image segmentation and critical constraints is proposed.The fluorescent oil film time-series image is divided into blocks and processed in parallel according to the resources of the GPU,and the corresponding optical flow parallel computing strategy is created,that is,the advantages of the parallel pipeline architecture of the GPU and the shared memory are fully utilized to realize the optical flow calculation of each parallel block.At the same time,combined with the critical constraints between blocks,the number of iterative calculations is controlled by the iterative difference of the speed matrix of each block as a symbol.The experimental results show that the method proposed in this paper is 2 789.5 times faster than the traditional CPU-based optical flow method under the condition of ensuring the calculation accuracy of the velocity field of the fluorescent oil film motion,and the average speed of the GPU optical flow method of the whole frame image is improved.10.09 times and the real-time solution speed can reach 90 frames per second.Key words:optical flow method;image block;critical constraint;fluorescent oil film;shared memory文章编号:1674-8190(2023)01-157-08收稿日期:20220302;修回日期:20220503基金项目:国家自然科学基金(11872069)通信作者:张征宇,zhang_引用格式:吴培灵,张征宇,孙维.基于 GPU 的荧光油膜运动路径实时测量J.航空工程进展,2023,14(1):157-164,174.WU Peiling,ZHANG Zhengyu,SUN Wei.Real-time measurement of fluorescent oil film motion path based on GPUJ.Advances in Aeronautical Science and Engineering,2023,14(1):157-164,174.(in Chinese)第 14 卷航空工程进展0引 言风洞试验模型表面的荧光油膜受来流的黏性摩擦作用,在模型表面产生位移(形成荧光油膜运动路径),因此,风洞试验中模型表面荧光油膜运动的时序图像蕴含了油膜在来流剪切力作用下的运动信息,即采用光学流动技术1-3处理模型表面荧光油膜运动的时序图像,可以解得模型表面流场的拓扑结构和荧光油膜运动路径速度场4-5。一方面,可定量观测模型壁面流场的奇点(结点和鞍点)分布,为掌握试验模型壁面发生流动分离的位置、分离方式与特点以及漩涡形成机理等提供重要的研究数据;另一方面,可用于计算模型的表面摩擦力分布信息6-8。G.Schrauf9研究发现,摩擦阻力(简称摩阻)占据飞行器所受总阻力的 45%50%,其占比大于其他阻力项,摩阻每降低 1%燃油消耗可下降0.625%。飞行器防护设计依赖于表面摩阻的测量10,在高超声速条件下,飞行器防护设计不当会导致飞行器的外壳烧毁或制造材料严重浪费。因此,摩阻测量研究对于飞行器的燃料节省、航程增加以及防护材料设计都有重要意义。L.C.Squire11在考虑剪切力作用下的油膜运动时推导得出薄油膜方程,为基于油膜的剪切应力测量技术奠定了基础;L.H.Tanner等12通过油膜干涉测量表面摩阻,将推导出的方程赋予实际意义,为后续研究打下了坚实的基础;随后 D.J.Monson 等13、J.L.Brown 等14对油膜演化方程进行了进一步完善;Liu Tianshu 等15提出了采用荧光油膜代替传统油膜的方法,进一步推进了摩阻的测量研究;李鹏16推导了荧光油膜控制方程并进行了简化,得到了荧光油膜测量方程,该方程表明,摩阻测量与荧光油膜运动速度、荧光油膜厚度相关,需要采用光流法求出荧光油膜运动速度再将厚度代入即可获得摩阻。在现有众多全局摩阻的测量技术中,如 Preston管法、热线法、MEMS 摩擦天平17等,大都需要依托复杂的外部设备,而且制造难度系数大、成本高、空间分辨率低、风洞环境条件要求高等问题都在一定程度上限制了其应用发展。荧光油膜摩阻测量方法具有设备简单、成本低、对环境模型无特殊 要 求、空 间 分 辨 率 高 等 优 点,是 当 前 研 究 的热点。荧光油膜运动路径速度求解在摩阻测量中是至关重要的环节,但采用光流法对荧光油膜进行运动速度求解时,因为其解算方程的数值计算涉及大量的卷积计算和多次迭代计算,导致基于中央处理器(Central Processing Unit,简称 CPU)的光流法求解一次风洞荧光油膜试验图像太耗时,需要花费 46 h18,且不能在试验过程中实时定量显示试验模型物面流态及其演化过程,降低了其工程应用的价值。现 有 的 现 场 可 编 程 门 阵 列19-20(Field-Programmable Gate Array,简称 FPGA)技术,受限于片上资源,加之编程难度大,目前常用于图像的预处理阶段。戚烜20的研究表明,对于分辨率为640480 的 普 通 图 像,其 光 流 解 算 时 间 为 22.7 ms。可见若利用 FPGA 进行较高分辨率的图像解算效果并不理想21。鉴于图形处理器22(Graphics Processing Unit,简称 GPU)既有擅长数据并行处理的架构,又具有大量与 CPU 相同的算术逻辑单元(计算能力优于 FPGA),因此,可以直接基于 GPU 并行迭代的硬件架构将图像分块,利用 CPU 无法比拟的大量线程完成分块图像数据的并行计算,即有通过硬件加速实现实时求解光流方程的可能性。同时,相较于 FPGA 技术,统一计算设备架构(Compute Unified Device Architecture,简称 CUDA)编程更灵活,从而为模型表面流场的拓扑结构和荧光油膜运动路径速度场实时观测提供了一条新的可行路径。A.Plyer 等23和 孙 瑞 鑫 等24分 别 实 现 了 以14.4和 30帧/秒的计算速度解算分辨率为 1 9201 080 的图像,但仅适用于特定场景。对于风洞试验的高分辨率高帧率图片而言,这样的计算速度无法满足工业实时解算需求。为此,本文提出基于荧光油膜图像分块和临界约束的 GPU 荧光油膜运动路径实时测量方法,将荧光油膜时序图像按GPU 的资源自适应分块,分别创建其对应的光流并行计算与块边界光滑约束方法,充分利用 GPU的并行架构优势,实现实时定量观测模型表面流场的拓扑结构和荧光油膜运动路径速度场。1油膜图像的分块并行约束法本文提出荧光油膜时序图像按 GPU 的资源分块方法,在 GPU 上将待计算的图像先进行分块处158第 1 期吴培灵等:基于 GPU 的荧光油膜运动路径实时测量理,分块后的图像子块分别存储于 GPU 的共享内存上,利用 GPU 多线程对需要光流解算的每帧图像数据进行并行计算,可大量减少内存数据的存储次数,从而减少光流迭代计算中的时间消耗,再针对图像中存在突变噪声或者运动趋势不明显的情 况,以 块 为 单 位 添 加 约 束 条 件,减 少 冗 余 计算量。1.1GPU的并行架构GPU 上含有多个流式处理器(Streaming Multiprocessors,简称 SM),如图 1 所示,每个 SM 中包含有多个 block,一个 block的