AdvancesinAppliedMathematics应用数学进展,2024,13(4),1643-1647PublishedOnlineApril2024inHans.https://www.hanspub.org/journal/aamhttps://doi.org/10.12677/aam.2024.134156文章引用:伊力米努尔·艾克拜尔.基于机器学习试析孟德尔随机化研究中R2值预测模型[J].应用数学进展,2024,13(4):1643-1647.DOI:10.12677/aam.2024.134156基于机器学习试析孟德尔随机化研究中R2值预测模型伊力米努尔·艾克拜尔新疆大学外国语学院,新疆乌鲁木齐收稿日期:2024年3月25日;录用日期:2024年4月22日;发布日期:2024年4月29日摘要孟德尔随机化研究在现代遗传学领域具有重要意义。它利用自然发生的基因突变作为工具,探究基因变异与生物特性之间的因果关系,从而克服了传统观察性研究中可能存在的混杂因素干扰,为生物特性机制的揭示提供了有力支持。然而与表型相关的研究数据中R2值很难获取,国内外公共数据库中也常缺失。因此本文以我国生物信息中心(CNCB)数据库中甘蓝型油菜(oilseedrape)开花时间相关的基因数据为学习素材,通过采取多种机器学习算法,试对比不同模型预测R2值的适用性。关键词遗传学,机器学习,孟德尔随机化AnalysisofthePredictionModelofR2ValueinMendelianRandomizationStudyBasedonMachineLearningYiliminuerAikebaierSchoolofForeignLanguages,XinjiangUniversity,UrumqiXinjiangReceived:Mar.25th,2024;accepted:Apr.22nd,2024;published:Apr.29th,2024AbstractThestudyofMendelianrandomizationisofgreatsignificanceinmoderngenetics.Itusesnaturallyoccurringgenemutationasatooltoexplorethecausalrelationshipbetweengenevariationandtraits,thusovercomingthepossibleconfoundingfactorsintraditionalobservationalstudiesand伊力米努尔·艾克拜尔DOI:10.12677/aam.2024.1341561644应用数学进展providingstrongsupportfortherevelationofdiseasepathogenesis.However,R2valueisdifficulttoobtaininresearchdatarelatedtophenotype,andisoftenmissinginpublicdatabasesathomeandabroad.Inthispaper,thegeneticdatarelatedtothefloweringtimeofoilseedrapeintheCNCBdatabasewasusedaslearningmaterials,andvariousmachinelearningalgorithmswereadoptedtocomparetheapplicabilityofdifferentmodelstopredictR2values.KeywordsGenetics,MachineLearning,MendelianRandomizationCopyright©2024byauthor(s)andHansPublishersInc...