ModelingandSimulation建模与仿真,2023,12(4),3657-3672PublishedOnlineJuly2023inHans.https://www.hanspub.org/journal/moshttps://doi.org/10.12677/mos.2023.124336文章引用:戴洋毅,何康,瑚琦,黄凯.CNN-Transformer混合模型在计算机视觉领域的研究综述[J].建模与仿真,2023,12(4):3657-3672.DOI:10.12677/mos.2023.124336CNN-Transformer混合模型在计算机视觉领域的研究综述戴洋毅1,2,何康1,2,瑚琦1,2*,黄凯11上海理工大学光电信息与计算机工程学院,上海2上海理工大学上海市现代光学系统重点实验室,上海收稿日期:2023年5月5日;录用日期:2023年7月10日;发布日期:2023年7月17日摘要近年来,CNN-Transformer混合模型在计算机视觉领域的研究已经成为热点话题之一。这种模型可以结合卷积神经网络(ConvolutionalNeuralNetwork,CNN)和Transformer各自的优势,提高模型在多种计算机视觉任务中的性能。首先对CNN与Transformer分别进行简述并分析其优缺点,然后通过介绍与分析近几年国内外表现出色的CNN-Transformer混合模型,对多种常见的混合方式进行分类阐述,这些方法旨在发挥卷积神经网络在局部特征提取方面的优势以及Transformer在全局信息建模方面的优势。最后,对CNN-Transformer混合模型在计算机视觉领域以及其他领域未来所面对的挑战和发展趋势进行展望。关键词计算机视觉,卷积神经网络,Transformer,混合模型,深度学习ReviewofCNN-TransformerHybridModelinComputerVisionYangyiDai1,2,KangHe1,2,QiHu1,2*,KaiHuang11SchoolofOptical-ElectricalandComputerEngineering,UniversityofShanghaiforScienceandTechnology,Shanghai2ShanghaiKeyLaboratoryofModernOpticalSystems,UniversityofShanghaiforScienceandTechnology,ShanghaiReceived:May5th,2023;accepted:Jul.10th,2023;published:Jul.17th,2023AbstractInrecentyears,researchonCNN-Transformerhybridmodelsincomputervisionhasbecomeone*通讯作者。戴洋毅等DOI:10.12677/mos.2023.1243363658建模与仿真ofthehottesttopics.ThistypeofmodelcombinestheadvantagesofConvolutionalNeuralNet-works(CNN)andTransformerstoimprovetheperformanceofvariouscomputervisiontasks.First,theprosandconsofCNNandTransformerarebrieflyintroducedandanalyzed.Subse-quently,variouscommonhybridmethodsareelaboratedthroughtheintroductionandanalysisofoutstandingCNNtransformerhy...