信息记录材料2022年12月第23卷第12期51论著0引言在智慧教育相关的课题研究中,学生课堂行为识别问题一直是研究的重点内容。随着计算机存储和计算技术的发展,人工智能融入教育领域,为学生课堂行为量化分析提供了可能。疫情以来,线上课堂已成为教学中不可或缺的一部分,如何在线上课堂掌握学生的学习状况,为教师提供客观的课堂情况是亟待解决的问题。因此,将深度学习引入教学活动,了解学生的上课状态,对教学改革具有积极意义[1-2]。在针对学生行为识别的研究中,对于学生相似动作难以区分识别的情况,张鑫褆[3]基于人体2D骨架提出多维融合的LSTM网络,在克服梯度弥散的条件下,提高了对相似动作的识别率;周叶[4]在经典的实例分割算法FasterR-CNN的基础上,利用特征金字塔解决不同尺度学生课堂行为检测的同时,将视频中上一帧的检测结果作为当前帧的目标候选框,实现了比较准确的学生身份关联;柯斌等[5]用InceptionV3网络对学生行为进行识别,但模型忽视了手机,笔和课本等重要信息的特征,使得看书,低头玩手机行为容易混淆;Abdallah等[6]对数据集进行数据增强,通过深度迁移学习的方法,在学生课堂表情识别中取得79.4%的准确率;Lin等[7]使用OpenPose框架收集骨骼数据,提出一种基于姿态估计和人物检测技术的误差校正方案,以减少骨架数据中的错误连接,构建表示人体姿势的特征向量。采用关节位置、关节距离和骨角度等特征对学生行为分类。上述方法虽然对学生行为进行识别,但模型识别准确率不高、鲁棒性较差、有效特征的提取不足。本文在YOLOV5模型的基础上改进,加入CA注意力模块从空间和通道两个维度提升网络的特征提取能力,提高特征提取的有效性,增加模型的鲁棒性,在保证模型实时检测的情况下,实现了对学生课堂抬头听课、玩手机、睡觉等七种行为识别率的提高。1目标检测算法1.1YOLOV5目标检测模型YOLOV5是Ultralytics公司2020年5月发布的目标检测网络模型。YOLOV5输入端有自适应缩放,Mosaic数据增强,目的是为了增加数据的多样性,使模型的泛化性能更好。Backbone有Focus、CSP、SPP等网络模块,主要目的是提取特征图。Neck部分是特征融合阶段,采用FPN+PAN(特征金字塔和路径聚合网络)网络。基于改进YOLOV5算法的学生课堂行为识别研究杨明远,左栋(华北水利水电大学数学与统计学院河南郑州450046)【摘要】将人工智能引入课堂教学活动,基于深度学习的方法智能识别学生在课堂上的行为,及时了解学生的上课状态,对教学改革具有...