2023年2月25日第7卷第4期现代信息科技ModernInformationTechnologyFeb.2023Vol.7No.41931932023.022023.02收稿日期:2022-09-26基金项目:广东省教育评估协会2021年度研究课题(21GJYPG10);北京理工大学珠海学院校级教学改革项目(2020009JXGG)基于教育数据挖掘的学生画像构建与学情预测分析研究唐茜(北京理工大学珠海学院,广东珠海519088)摘要:该研究通过采集学生在校的图书借阅、参加公益活动、上网等行为数据,采用随机森林算法挖掘行为特征与学业成绩之间的关联程度,提取关键特征进行加权计算合并形成新特征,通过基础模型K-means算法进行聚类分析,最终将学生划分成自律学霸型、夜猫子上网型和缺乏规划型三类学生。基于Logistics回归模型建立预测模型,分别讨论三类群学生的学习成绩预测效果,为教育工作者深入诊断学生的学习状态并给予精准的教学引导和干预提供参考。关键词:教育数据挖掘;行为数据;学生画像;关联度;预测分析中图分类号:TP311文献标识码:A文章编号:2096-4706(2023)04-0193-06ResearchonStudentPortraitConstructionandLearningConditionPredictionBasedonEducationalDataMiningTANGQian(BeijingInstituteofTechnology,Zhuhai,Zhuhai519088,China)Abstract:Bycollectingthebehavioraldataofstudents'bookborrowing,participatinginpublicwelfareactivitiesandsurfingtheInternet,thispaperusestherandomforestalgorithmtominethecorrelationdegreebetweenbehaviorcharacteristicsandacademicperformance,andthekeycharacteristicsareextractedtoweightandcalculateformergertoformnewcharacteristics.ThroughtheclusteringanalysisofthebasicmodelK-meansalgorithm,thestudentsaredividedintothreetypesofexcellentperformanceinself-discipline,latesleeperswithInternetaccessandlackofplanning.Thispaperestablishesapredictionmodelbasedonthelogisticregressionmodel,anddiscussesthepredictioneffectofthethreetypesofstudents,whichprovidesareferenceforeducatorstodeeplydiagnosestudents'learningstatusandgivepreciseteachingguidanceandintervention.Keywords:educationaldatamining;behavioraldata;studentportrait;correlation;predictionanalysis0引言教育信息化2.0时代,教育进入以大数据驱动的新时代。目前,高校内积聚了学生的各类在校行为数据并逐步构建成为智慧校园。学生画像作为智慧...