温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
means
BP
高校
专业
核心
课程
成绩
预测
张政庭
第 卷第期 年月中国医学教育技术 基金项目:重庆医科大学未来医学青年创新团队支持计划()收稿日期:作者简介:张政庭(),男,湖北黄冈人,助理工程师,硕士,研究方向为高等教育、计算机应用。通信作者:袁龙(),男,四川南充人,讲师,硕士,研究方向为医学教育。电话:;:基于 神经网络的高校专业核心课程成绩预测张政庭,周恒宇,崔璀,袁龙重庆医科大学:护理学院;附属儿童医院,重庆 【摘要】为挖掘专业核心课程与公共基础课程、专业基础课程的潜在联系,实现高校专业核心课程成绩的预测,构建基于 聚类与 神经网络的预测方法。以学生公共基础课程、专业基础课程成绩为预测基本数据,根据 聚类结果将基本数据划分用于训练成绩预测模型,并随机选取某高校护理专业一个年级 名学生的成绩进行验证。实验结果表明,专业核心课程的成绩与公共基础课程、专业基础课程存在潜在联系;同时,所构建的专业核心课程成绩预测方法具有泛化能力更好、预测误差更小、预测精度更高的特点,可用于预测学生专业核心课程成绩,为高校教师教学质量提升提供依据,助力高校人才培养。【关键词】聚类;神经网络;专业核心课程;成绩预测【中图分类号】【文献标志码】【文章编号】()【】,:.;.,【】,【】;高校是人才培养的主阵地,其主要职能是进行高等专业人才的培养,在人才培养过程中,课程体系直接决定人才培养质量,是人才培养的载体,关系到人才培养目标的实现。课程体系一般包含公共基础课、专业基础课和专业核心课程。公共基础课程是专业课学习所需要的前修课程,专业核心课程是在专业基础课程上更细化、更深层次的学习。在专业核心课程日常教学中,教师可根据课程成绩,调整教学方案和行为,有针对性地对不同群体学生进行学习干预并给予教学指导,然而目前教师无法第 卷第期张政庭等基于 神经网络的高校专业核心课程成绩预测在学生成绩公布之前掌握学生的学习情况,因此对专业核心课程成绩进行预测显得尤为重要。在成绩预测领域,学者们利用了决策树、线性回归、贝叶斯网络、支持向量机等实现对学生成绩的预测。神经网络是由输入层、隐含层、输出层组成的前馈神经网络,通过输入样本训练网络构建的非线性映射关系在函数非线性逼近等问题上具有较强的复演能力,可实现成绩的预测,具有结构简单、运算复杂度较低、实用性强等特点。由此,为挖掘专业核心课程与公共基础课程、专业基础课程的潜在联系,提高专业核心课程成绩预测的准确率,提出一种结合 聚类与 神经网络的成绩预测方法,使用 算法对所提取到的公共基础课程和专业基础课程成绩进行分类,在分类的基础上划分出训练数据,利用 神经网络进行预测模型训练。从实验结果来看,专业核心课程与公共基础课程、专业基础课程存在潜在联系,且可以利用潜在关系预测成绩,成绩预测的结果具有较小的误差、较高的精度。聚类 聚类具有实现简单且效果优秀的特点,在进行数据集分类时,可实现分类后的各簇数据样本间不相似,而样本内的个体具有彼此相似的特性,具有容易实现且算法高效的特点。设样本集为含有个学生样本的课程成绩数据集合:,.,每个学生样本有门成绩组成,第个学生样本表示为:(,.),表示为学生的第门课程成绩,则任意两个样本用欧式距离表示为:(,)()()算法实现过程可描述如下:输入个样本的行为资源数据集合,聚类个数;:初始化聚类中心;:根据样本间欧式距离公式(),计算样本与各中心点欧式距离,并将该样本划分到与中心点欧式距离最近的簇中;:计算、更新每个簇的中心点;:各簇中心点是否改变(没有对象被重新分配给不同的簇);没有改变,转到 ,否则转到 ;:输出聚类结果。为确定最优的聚类个数,可以将聚类的误差平方和作为聚类效果的评价指标,定义如下:()其中,表示聚类的误差平方和,是样本点到各簇中心点距离的平方和,聚类效果越好,其值越小。表示第个簇,表示第个簇的中心点。神经网络 神经网络即误差反向传播神经网络(,),又称 算法,是一种运用梯度下降法计算最小的损失函数及模型的参数值,最终目的得到网络的实际输出与期望的输出误差、均方差达到最小,是一种多层的前向型神经网络。神经网络由输入层、隐含层、输出层组成,其中隐含层有多个节点或神经元(如图所示):其中为输入层的个输入,隐含层的神经元个数用表示,为隐含层个神经元与输出层个神经元的权重,为个输出。图 神经网络根据 神经网络的正向传播与误差反向传播的学习过程,模型的参数调整过程主要有信号的前向传播和误差反向传播。信号的前向传播为隐含层第个神经元的阈值,为隐含层的激活函数,为输出层第个节点的阈值,为输出层的激活函数,则隐含层第个节点的输入可以记作:()根据隐含层激活函数计算该节点的输出用表示:()()()此时,隐含层各节点输出作为输出层的输入值,输出层第个节点的输入为:中国医学教育技术第 卷第期 ()同理,根据输出层激活函数计算该节点的输出为:()()()误差反向传播记期望输出与输出层的实际输出值的误差为:()单个样本的均方误差可表示为:()()则对于训练样本数为时,其均方误差为:()()根据梯度下降算法修正输入层、隐含层的权重和阈值,输入层记为 和;输出层记 和,可表示为:()()()()()()()()()()其中,代表网络学习率。预测方法基于 聚类与 神经网络的高校专业核心课程成绩预测方法主要包括以下几个过程:数据采集、归一化处理采集学生在学习专业核心课程之前的公共基础课程、专业基础课程的成绩,作为专业核心课程成绩预测的基本数据集;同时为确保数据的统一性和准确性、提高算法收敛速度,需要对数据集进行归一化处理,一般将数据归一化到,范围内,按式()进行处理:()其中,、分别表示归一化前后的数值,、分别为归一化前的最小值和最大值。算法聚类、数据分类基本数据集经过归一化处理后,通过 算法划分为不同的簇,使得相同簇中的数据具有相似性,而不同簇类的数据不相似。根据划分的簇、神经网络训练数据的要求,将数据分配到训练集和测试集中,作为 神经网络模型的训练数据集。神经网络构建、训练、仿真初始化 神经网络的权重和阈值,依据得到的输入层输入数据,根据式()和式()得到隐含层输入,经过隐含层的激活函数由式()得到该节点的输出;同样的方法,根据式()得到输出层的值。在经过一次训练后得到的输出结果,根据式()()计算出均方误差,此时判断均方误差是否达到要求(或者超过迭代次数),若满足要求,则程序结束;否则根据式()()计算出权重和阈值的修正参数,调整隐含层到输出层权重及输出层阈值、输入层到隐含层权重及隐含层各节点的阈值。测试集数据经过反复多次的训练,可得到理想的 神经网络,此时利用该 神经网络,对测试集的数据进行预测,仿真得到的数据即为 神经网络的预测结果。基于 聚类与 神经网络的高校专业核心课程成绩预测方法如图所示。图专业核心课程成绩预测方法评价指标为 神经网络预测值,预测误差表示为:()预测精度表示为:第 卷第期张政庭等基于 神经网络的高校专业核心课程成绩预测 ()实验结果与分析使用 作为实验仿真环境,对专业核心课程成绩进行预测。以国内某高校护理专业学生为例,年级学生一共 人,从教务系统中导出公共基础课程、专业基础课程共 门课程的成绩数据,该数据作为专业核心课程的成绩预测原始数据,采用式()的方法得到归一化的数据。参数设置 聚类参数确定 算法是一种无监督的算法,为准确地确认成绩数据的分类数量,根据式()计算在不同聚类个数下聚类误差平方和(如图所示),误差平方和根据聚类个数变化,在变化过程中会出现一个拐点,即下降率突然变缓,也称为“肘”点,可认为最佳聚类数,由图可得到最佳聚类数为。图聚类误差平方和 神经网络相关参数按照 定理,单个隐含层的 神经网络将能够无限接近任意连续的非线性曲面,该次实验所采用的是单个隐含层的神经网络。隐含层节点的数量根据经验公式确定,为输入层的输入数,为输出层的输出数,取值为,的整数。则该次实验的取值范围为,的整数。对不同的节点数,神经网络分别训练 次,不同节点数对应的测试集的平均绝对误差(,)和均方根误差(,)如表所示,可以看出 神经网络随着隐含层节点数的增加,平均绝对误差和均方根误差呈现增大趋势,为了提高网络运行的效率,选择隐含层阶段数为。对于隐含层和输出层的激活函数,一般分别选择最常用的 函数和 函数。表 神经网络不同节点数误差值节点数平均绝对误差 均方根误差 实验结果与分析为了验证基于 聚类与 神经网络的高校专业核心课程成绩预测方法(下文方法一)效果,在进行仿真实验时,增加基于 神经网络的高校专业核心课程成绩预测方法(下文方法二)作为对比,即经过归一化后的数据,不经过 算法聚类,直接进行分类,两类方法的实验结果如下:图和图通过回归线表示两种方法训练神经网络对应数据的拟合程度。比较两个图的数据拟合程度可以观察到:在训练目标、校验目标、测试目标的拟合上,方法一的拟合情况均好于方法二,且对于整体数据的拟合,方法一要优于方法二。总体来说,方法一训练得到的神经网络对于数据的拟合能力优于方法二。图方法一 神经网络拟合情况中国医学教育技术第 卷第期图方法二 神经网络拟合情况为了充分比较方法一和方法二在数据成绩预测上的结果,使用两类方法分别对未经 聚类进行分类的测试集和经过 算法聚类进行分类的测试集进行预测,可以得到两种方法的预测结果、误差、精度,图表示两种不同方法训练的神经网络,对未经 聚类进行分类的测试集的预测结果。表列出的是针对分类后划分的测试集,根据式()计算的预测成绩误差所在的区间个数及比例。表根据式()计算的数据预测精度。对于未经 算法分类的测试集合,分别使用两种不同方法训练的神经网络进行成绩的预测。从预测的结果来看,方法一训练的神经网络预测结果要好于方法二的结果,具体表现在:方法一预测的成绩误差在范围内的人数占比较方法二多,且预测结果误差范围均未超过,测试集中 的样本的精度超过,其中 的样本预测精度在 ;方法二预测结果的误差分布范围比方法一更广,同时存在误差超过 的结果,并且各区间预测精度均没有方法一精度高。图未经 聚类进行分类的测试集预测结果表预测结果误差分布预测误差(,),),),),),),),)方法一()()()()()()()()()方法二()()()()()()()()()表成绩预测精度预测精度 ,),),),),)方法一 方法二 第 卷第期张政庭等基于 神经网络的高校专业核心课程成绩预测图表示两种不同方法训练的神经网络,对经 聚类进行分类的测试集的预测结果。表所列出的是针对分类后划分的测试集,根据式()计算预测成绩误差所在的区间个数以及所占比例。表根据式()计算的数据预测精度。图经 聚类进行分类的测试集预测结果表预测结果误差分布预测误差(,),),),),),),),)方法一()()()()()()()()()方法二()()()()()()()()()表成绩预测精度预测精度 ,),),),),)方法一 方法二 对于未经 算法分类的测试集合,分别使用两种不同方法训练的神经网络进行成绩的预测,从预测的结果来看:方法一训练的神经网络的预测结果要好于方法二的结果,具体表现在,方法一预测的成绩误差在范围内的人数占比更多,的预测结果误差范围控制在,预测结果的精度绝大部分在 以上;方法二预测的成绩不但误差分布范围较大,而且误差范围超过 的占比超过,预测结果精度中仅 超过 的预测精度,同时还有预测精度没有达到 的结果。结束语所构建的基于 神经网络的高校专业核心课程成绩预测方法,挖掘了专业核心课程与公共基础课程、专业基础课程的潜在联系,即可通过公共基础课程成绩、专业基础课程成绩,对学生的专业核心课程成绩进行预测,并采集了某高校护理专业学生成绩进行验证。实验数据和结果表明,所提出的预测方法泛化能力较好,预测的成绩与期望成绩误差范围较小,预测成绩的精度较高,专业核心课程授课教师可在课程开课前利用学生的公共基础课程成绩和专业基础课程成绩对学生该门课程的成绩进行预测,根据预测的结果,有针对性地关注、帮扶成绩不理想的学生,为专业课程授课教案和方法的调整提供支撑,助力高校人才培养质量的提高。(下转第 页)中国医学教育技术第 卷第期循环的过程