Chem.J.ChineseUniversities,2023,44(7),2023016520230165(1/8)CHEMICALJOURNALOFCHINESEUNIVERSITIES高等学校化学学报研究论文基于分子性能与器件制备的低泛化误差有机太阳电池光电转化效率预测模型张妍,蒋行健,刘明,郑植,张勇(哈尔滨工业大学材料科学与工程学院,哈尔滨150001)摘要近年来,有机太阳电池是一个非常活跃的研究领域,为了提高其光电转化效率,所采取的优化策略主要分为新型给体或受体的开发和器件制备工艺优化两类.但由于其影响因素的数量较多及其复杂的相互作用机制,几乎不可能建立一个完整的理论来预测器件的光电转化效率,而机器学习可能是一个潜在的解决方案.本文将描述分子性能与器件制备的参数相结合用以构建数据集.为了降低泛化误差,模型分别由随机森林、支持向量机和多层感知器生成,其中随机森林展现出最佳性能.对随机森林进一步优化的结果显示,100种不同随机状态的测试集R2的平均值收敛于0.9012,并给出了数据集各参数重要性的定量结果.研究发现,数据集的构建对机器学习模型的性能与结论起着至关重要的作用.关键词有机太阳电池;机器学习;随机森林;泛化误差中图分类号O641;O629文献标志码Adoi:10.7503/cjcu20230165PredictEfficiencyofOrganicSolarCellwithLowGeneralizationErrorBasedonMolecularPropertyandDeviceFabricationZHANGYan,JIANGXingjian,LIUMing,ZHENGZhi,ZHANGYong*(SchoolofMaterialsScienceandEngineering,HarbinInstituteofTechnology,Harbin150001,China)AbstractOrganicsolarcells(OSCs)havebeenaveryactiveresearchfieldinrecentyears.Therearetwomainopti⁃mizationstrategieswhicharenoveldonororacceptoranddevicefabrication.Duetothehugenumberofinfluencingfactorsandtheircomplicatedinternalinteractionmechanism,it’salmostimpossibletobuildacompletetheorytodescribeandanalyzedevicepowerconversionefficiency(PCE).However,machinelearningmaybeafeasibleanswer.Inthisresearch,molecularpropertiesanddevicefabricationarecombinedtobuilddataset.Todecreasegeneralizationerror,modelsaredevelopedbyrandomforest,supportvectormachineandmultipleperceptron.Randomforestshowsthebestperformanceandisdeterminedtothefinalalgorithm.Afterfurtheroptimization,thetestsetR2averageof100differentrandomstateconvergeson0.9012andthequantitativeresultsoffea...