第49卷第4期2023年4月ComputerEngineering计算机工程晶硅分子动力学模拟的GPU加速算法优化林琳1,祝爱琦2,赵明璨2,张帅2,叶炎昊2,徐骥2,韩林3,赵荣彩3,侯超峰2(1.郑州大学信息工程学院,郑州450001;2.中国科学院过程工程研究所,北京100190;3.郑州大学国家超级计算郑州中心,郑州450001)摘要:分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待等问题,结合NvidiaTeslaV100GPU硬件体系结构特点,对晶硅MD模拟算法进行设计。通过全局内存的合并访存、循环展开、原子操作等优化方法,利用GPU强大并行计算和浮点运算能力,减少显存访问及算法执行过程中的分支冲突和判断指令,提升算法整体计算性能。测试结果表明,优化后的晶硅MD模拟算法的计算速度相比于优化前提升了1.69~1.97倍,相比于国际上主流的GPU加速MD模拟软件HOOMD-blue和LAMMPS分别提升了3.20~3.47倍和17.40~38.04倍,具有较好的模拟加速效果。关键词:分子动力学;图形处理器;合并访存;循环展开;原子操作;性能优化开放科学(资源服务)标志码(OSID):中文引用格式:林琳,祝爱琦,赵明璨,等.晶硅分子动力学模拟的GPU加速算法优化[J].计算机工程,2023,49(4):166-173.英文引用格式:LINL,ZHUAQ,ZHAOMC,etal.GPU-acceleratedalgorithmoptimizationformoleculardynamicssimulationofcrystallinesilicon[J].ComputerEngineering,2023,49(4):166-173.GPU-AcceleratedAlgorithmOptimizationforMolecularDynamicsSimulationofCrystallineSiliconLINLin1,ZHUAiqi2,ZHAOMingcan2,ZHANGShuai2,YEYanhao2,XUJi2,HANLin3,ZHAORongcai3,HOUChaofeng2(1.SchoolofInformationEngineering,ZhengzhouUniversity,Zhengzhou450001,China;2.InstituteofProcessEngineering,ChineseAcademyofSciences,Beijing100190,China;3.NationalSupercomputingCenterinZhengzhou,ZhengzhouUniversity,Zhengzhou450001,China)【Abstract】MolecularDynamics(MD)isoneofthemainmethodsusedtostudythethermodynamicpropertiesofsiliconnano-films;however,thesestudieshaveproblemssuchasprocessingmassiveamountsofdata,computationalintensity,andcomplexinteratomicinterac...