55计算机教育ComputerEducation第11期2023年11月10日中图分类号:G642交互式大模型驱动的大数据技术实践课程教学探索杨尚东,陈蕾,陈兴国,陈志(南京邮电大学计算机学院,江苏南京210023)摘要:针对大数据技术实践课程中缺乏实际场景数据的现状,分析交互式大模型与大数据技术实践的关联性,提出在大数据技术实践课程中融合交互式大模型的教学框架和流程,以大数据技术实践课程为例介绍教学实践过程,最后说明教学实践结果。关键词:交互式大模型;数据科学与大数据专业;大数据技术实践课程;CDIO教学模式0引言新时代背景下,国家高度重视数据作为新型生产要素的基础资源作用和创新引擎作用[1]。各高校先后开设数据科学与大数据专业,旨在培养具备数据处理、数据分析、数据挖掘等方面技能的专业人才,该专业涉及计算机科学、统计学等相关学科,对人才培养的要求不仅需要具备丰富的理论知识,还需要具备更强的实践能力。大数据技术实践是数据科学与大数据专业的核心实践课程,但是由于大数据技术实践涉及前继课程多、应用性要求高,学生难以对数据进行高效理解和处理。目前,高校从多方面对大数据技术实践课程进行改革,文献[2]从大数据实践课程体系方面,探索了适应数据科学人才培养新方案;文献[3]探讨了不同大数据平台建设对实践类课程教学改革的影响;文献[4]从OBE教学理念出发,取得了良好的实践效果。上述课程改革忽略了实践对象“数据”作为核心要素对实践教学过程的影响。首先,获取足够的真实、多样、高质量的大规模数据不易,学校无法提供足够多的实际数据集供学生使用,且真实数据的获取可能涉及隐私、法律等方面的限制;其次,大规模数据通常包含噪声、缺失值、异常值等,需要进行清洗和预处理才能得到可用的数据集。上述挑战会导致学生在实践中缺乏兴趣,繁杂的清洗工作也会占据学生大量实践时间。仿真引擎在计算机专业课教学中扮演着重要的角色[5-6],近年来,仿真引擎发展至以大数据和大算力驱动的交互式大模型[7-9],学生利用IO/API接口与大模型进行交互,获得仿真数据、相关原理和执行过程。在大数据技术实践教学中,针对大数据获取和预处理难的特点,引入交互式大模型,学生可以根据自己兴趣,选择不同的交互模式产生数据,明晰数据产生的机理,学习不同交互分布下产生的数据处理方法,从而提升实践教学效果。1交互式大模型与大数据技术实践大数据技术实践课程通过完成数据存储设计、数据分析处理、数据展示等,培养学生的大...