分享
基于Apriori算法的大学生体测项目关联规则挖掘_王劭华.pdf
下载文档

ID:2367768

大小:1.08MB

页数:6页

格式:PDF

时间:2023-05-10

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 Apriori 算法 大学生 项目 关联 规则 挖掘 王劭华
计算机与现代化JISUANJI YU XIANDAIHUA2023年第3期总第331期0引言近年来,大学生的各项体测数据显示,大学生群体的身体素质有逐年弱化的趋势1-2。国务院下发规划文件,到2030年,实现国家学生体质健康标准达标优秀率25%以上的目标3。大学生体测数据的分析方法主要有3种,分别是教学实验法、数理统计法和逻辑分析法4,教学实验法的缺点是采集数据的时间长,因为要进行上下学期体测成绩对比分析,优点是针对性强、可解释性强;数理统计法的缺点是对数据量少的样本统计分析的结果较不合理,优点是对有一定量的数据进行统计分析方法较通用;逻辑分析法的缺点是专业知识要比较熟悉,优点是可以将结果和原因结合起来可解释性分析。随着人类社会的发展,越文章编号:1006-2475(2023)03-0066-05收稿日期:2022-03-02;修回日期:2022-05-29基金项目:国家社科基金资助项目(16BTY061);江西省03专项及5G项目(20204ABC03A26)作者简介:王劭华(1982),男,甘肃金昌人,讲师,硕士,研究方向:运动训练,E-mail:;通信作者:杨松涛,男,副教授,研究方向:体育教育运动训练,民族传统保健体育,E-mail:。基于Apriori算法的大学生体测项目关联规则挖掘王劭华1,欧阳会丹2,孙丹3,王康3,吴鸿萍2,钟询2,褚兴平1,杨松涛1(1.江西中医药大学体育健康学院,江西 南昌 330004;2.江西农业大学软件学院,江西 南昌 330045;3.江西省科技基础条件平台中心,江西 南昌 330003)摘要:大学生身体素质是力量、速度、耐力、柔韧和灵敏的综合表现,为了测量大学生的身体素质情况并分析改善大学生的身体素质,本文分别测量了大学生中男生的各项指标(引体向上、50 m、1000 m、坐位体前屈和跳远)和女生的各项指标(一分钟仰卧起坐、50 m、800 m、坐位体前屈和跳远)。本文使用Apriori算法分别做了3组实验,即在最小支持度为50%和最小置信度为70%,最小支持度为60%和最小置信度为70%,最小支持度为70%和最小置信度为70%的前提下对某大学近5年的男生和女生的各项指标进行关联规则挖掘。实验结果表明:体重正常的学生每项体测分别及格的最小置信度都为70%以上,在所有关联项结果中最高的最小置信度为肺活量及格与体重正常的最小置信度为87.7%,而体重异常的学生体测分别及格的最小置信度都不大于70%。在所有关联项结果中身高与各项体测之间的最小置信度差异不明显。这验证了Apriori算法在大学生身体素质关联规则挖掘中发挥着重要的作用,利用挖掘出来的频繁项集,能够很好地辅助各大高校改善大学生的身体素质。关键词:数据挖掘;Apriori算法;大学生体测项目;关联规则挖掘中图分类号:TP391文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.03.012AssociationRuleMiningofUndergraduatePhysicalTestItemsBasedonAprioriAlgorithmWANG Shao-hua1,OUYANG Hui-dan2,SUN Dan3,WANG Kang3,WU Hong-ping2,ZHONG Xun2,CHU Xing-ping1,YANG Song-tao1(1.College of Physical Education and Health,Jiangxi University of Traditional Chinese Medicine,Nanchang 330004,China;2.School of Software,Jiangxi Agricultural University,Nanchang 330045,China;3.Jiangxi Science and Technology Infrastructure Center,Nanchang 330003,China)Abstract:Physical quality of college students is the comprehensive performance of strength,speed,endurance,flexibility andagility.In order to measure the physical quality of college students and analyze the improvement of their physical quality,thevarious indexes of male students(pull-up,50 m,1000 m,sitting forward and long jump)and the various indexs of female students(one-minute sit-up,50 m,800 m,sitting forward and long jump)are measured.In this paper,Apriori algorithm is usedto carry out three groups of experiments respectively,namely under the premise of support of 50%and confidence of 70%,support of 60%and confidence of 70%,support of 70%and confidence of 70%,association rule mining is carried out on various indicators of male and female students in a certain university in recent five years.The experimental results show that the confidenceof normal weight students to pass each body test is more than 70%,and the highest confidence of all related items is 87.7%forpassing vital capacity and normal weight,while the confidence of abnormal weight students to pass each body test is less than70%.There is no significant difference in confidence between height and body measurements among all related items,which verifies that Apriori algorithm plays an important role in the mining of association rules of college studentsphysical fitness.Usingthe mined frequent item set,it can well assist universities to improve the physical fitness of college students.Key words:data mining;Apriori algorithm;undergraduate physical measurement project;association rule mining2023年第3期来越多的数据被产生,曾经因为数据分析技术缺乏导致获取的信息贫乏,解决这一问题的技术5就是数据挖掘(Data Mining)。常用的数据挖掘算法包括关联规则算法、支持向量机算法6、人工神经网络算法7、决策树算法8-10等,这些算法能够从不同角度对数据中隐藏的有效信息进行挖掘。当今,关联规则算法是数据挖掘学科的重要组成部分11。数据挖掘技术在大学生体测数据中,可以挖掘数据中隐藏的关联信息,原因是大学生体测数据的隐藏信息时效性和可读性更强12。1993年,IBM公司Almaden研究中心提出了关联规则挖掘概念13及相关算法。Zhong等人14将Apriori算法与copula 函数相结合,对美国亚利桑那州的洪水风险情况进行分析,其挖掘的结果对于山洪灾害风险分析和决策具有重要参考价值。Apriori算法是一种经典的数据挖掘算法之一,是被用于确定预测学生毕业率的最主要因素15。此外,还有其他方面的应用,关联规则挖掘不限于市场篮子应用程序,也用于许多应用程序,如健康、工业、网络领域等16。不同类型的配网施工项目众多,施工过程中产生了大量复杂的数据关系。基于Apriori算法,研究了关键管理指标与控制指标的关系,为配网建设的管理和控制提供了参考17。又比如在汽车生产过程备件采购时,需要与汽车零部件相关的信息或知识,使公司的生产过程和结果有效。应用Apriori算法来预测经常出现的汽车零件,可以确定与该类汽车备件相关的策略。根据已经进行的提升比测试,对于预测宝马汽车零部件有2个非常强大和有效的规则,即宝马 320和宝马 7系列18。2021年,Praveena 等人19使用Web日志,对日志数据预处理后,用先验算法进行频繁项集的挖掘,与其他算法相比,本文使用的算法能够用最小属性集进行精确分类。同年,Suo 等人20利用大数据的 MapReduce计算框架,优化了先验关联规则算法,减少了先验算法在关联规则挖掘所需的计算空间,提高了计算速度。同年,Gopal 等人21在大数据Hadoop平台使用关联规则算法实现并行计算,满足了更大数据项关联的规则。同年,Dey等人22发现先验算法会多次扫描事务性数据库,导致一个不适当的推荐过程,因此使用频繁的模式挖掘算法FP-growth来解决图书馆平台中书籍推荐迅速响应的问题。2017年 5月,范生万等人23针对每一个分类的客户,利用Apriori算法进行关联规则分析,得到有用的关联规则以指导商品的精确营销。2017年8月,黄子航24运用关联规则对悉尼一家超市的部分数据进行分析、挖掘,判定发现不同类商品之间的关联度,挖掘出商品中隐藏的实用价值,利于增加超市公司的运营利润。2019年 1月,陈可嘉等人25通过构建商品间相似度矩阵,提出了一个基于商品相似度的关联规则扩展方法,从而实现对用户交易数据不足的商品生成可靠的关联规则推荐。最后以淘宝平台上的真实数据为例,验证该方法的有效性和实用性。2019年 5月,张生华等人26挖掘有强关联规则的商品,然后进行捆绑促销,优化超市商品布局,为顾客提供一个快捷便利的购物环境。2020 年 4 月,周冠茜27采用 Apriori关联规则算法分析超市购物清单中商品之间的关系,指导超市商品放置,超市购买指导。2020年11月,王宝军28利用关联规则挖掘算法构建多维度关联规则集,探索电子商务企业商品关联推荐的精准化与智能化应用研究。2021年2月,刘志林等人29根据商品间的强关联规则发现了顾客购买习惯的内在共性和实体零售企业在营销策略方面存在的问题,并提出了相关建议及改进措施。1Apriori数据挖掘算法设事务数据库 DB 中有 T%的事务包含 CN,则称 T%为关联规则 CN的最小支持度,是事务中包含C和N的事务数与所有事务数的比值,即概率值P(CN),可记作如公式(1):Support(C N)=P(C N)=T%(1)CN的最小置信度是包含C和N的最小支持度与包含C的最小支持度的比值,即概率值P(N|C),可记作公式(2):Confidence(C N)=Support(C N)Support(C)=P(N|C)(2)若人为设定一个最小支持度阈值min_sup

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开