温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
社会
网络分析
国内
数据
素养
研究
现状
展望
李亚设
2023年第19卷第3期64摘要:为 了解国内图情领域数据素养相关研究现状,采用社会网络分析方法对该领域的274篇文献进行定量梳理。在对发文年份、作者、机构和期刊4个方面的分布情况进行统计的基础上,通过对高频关键词的共现和系统聚类分析方法归纳该领域的研究热点,同时基于对已有文献的深入阅读提出未来研究展望,为相关研究提供参考。关键词:数据素养;知识图谱;社会网络分析;文献计量学中图分类号:G252 DOI:10.3772/j.issn.1673-2286.2023.03.009引文格式:李亚设.基于社会网络分析的国内数据素养研究现状与展望J.数字图书馆论坛,2023(3):64-71.李亚设(山东师范大学图书馆,济南 250300)基于社会网络分析的国内数据素养研究现状与展望*收稿日期:2023-01-03*本研究得到2021年度山东省教育教学研究一般课题“新文科背景下的教育学跨学科特征研究”(编号:2021JXY016)资助。2015年9月,国务院印发的 促进大数据发展行动纲要 指出,“大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响”1,表明数据以及数据利用能力对国家和社会发展的重要意义。随着大数据时代的到来,数据成为知识创新和社会发展的主要驱动力。数据素养正是伴随着大数据浪潮不断融入人们的科研、工作和生活领域而产生的一种新的能力诉求2。我国学者将数据素养的概念界定为:能够正当地发现和获取数据、批判性地对数据进行选择和评估、规范地管理和处理数据、合理地利用和共享数据的意识和能力3。一般认为,数据素养主要包括数据意识、数据知识与技能、数据伦理3个方面的内容。当前,许多学者已经对数据素养展开系统的研究,产生了大量的研究成果,也有学者对该领域的研究成果进行了梳理,例如:余维杰等4对国内外相关文献进行了定量统计,详细对比了国内外数据素养的研究现状;阳广元5通过对中国知网(CNKI)数据库中20142017年产生的文献进行梳理,对主要研究内容进行剖析,提出了该阶段研究的特点、不足与发展策略;王静茹等6利用CiteSpace可视化工具对国内20132021年发表的230篇文献进行了定量统计分析,梳理了数据素养研究的发展脉络。通过文献调研发现,已有研究中利用社会网络分析方法考察国内数据素养研究主题之间的网络关系、进行系统聚类分析的研究比较缺乏。因此,本文意在通过社会网络分析方法构建数据素养研究领域知识图谱,梳理各个主题内容之间的关联性,通过系统聚类方式揭示该领域的研究热点,并且在对文献进行深入阅读的基础上提出研究展望,以期为相关研究提供参考。1 数据来源与分析方法1.1 数据统计来源以CNKI为文献源,以“数据素养”为篇名、关键词和主题词分别进行检索,将学科限定在“图书情报探索与交流2023年第19卷第3期65基于社会网络分析的国内数据素养研究现状与展望李亚设与数字图书馆”,将期刊限定为中文社会科学引文索引(CSSCI)、中文核心期刊要目总览 和中国科学引文数据库(CSCD)来源期刊,检索时间为2022年7月3日,共检索到已发表文献277篇,经过文献筛选最终得到有效文献274篇。以这些文献为研究对象,对相关研究进行整理和归纳,以了解该领域的主要研究内容和现状。1.2 数据分析方法主要采用文献计量学和社会网络分析方法进行数据分析。文献计量学方法是指利用数学和统计学方法对文献的基本特征进行描述的定量研究方法。社会网络分析是由社会学家根据数学方法和图论发展而来的定量分析方法4,可以用来考察若干组行动者之间的互动关系7,这里的行动者可以指代任何社会实体(如一个人、一个组织、一篇文章等),每一个行动者都可以用一个网络节点来表示,通过对行动者相互关系的分析来探讨行动者网络的结构及属性特征。一个社会网络通常是由若干节点及其关系的连线组成的集合8,其中的连线代表了各个节点之间存在的多种关系。本研究主要借助UCINET和SPSS软件对研究中的相关数据进行分析。2 文献统计分析2.1 发文年份分析国内最早的数据素养研究论文发表于2014年,孟祥保等9在 国外高校图书馆科学数据素养教育研究 中阐释了国外高校图书馆的教育模式,并结合我国教育现状提出发展建议。20152016年,国内数据素养研究论文数量开始迅速增长,这可能源于国家对大数据战略的重视,例如,2015年国务院发布 促进大数据发展行动纲要、2016年工业和信息化部发布 大数据产业发展规划(20162020年)等。20162021年,国内数据素养研究论文的年发文量均在40篇上下波动,其中2020年核心期刊发文量达到最高值,为46篇。总体来看,我国数据素养领域的研究还处于初级发展阶段,相关研究还不完善,核心期刊的年发文量在整体上呈现增长态势,可以预测相关研究在未来会进一步受到学者的关注。2.2 发文作者分析发文量是衡量科研人员研究成果的重要指标,一个领域内的高产作者对该领域的研究起着重要的引领作用。本文所调研文献的作者共有396人,其中:发表2篇以上论文的作者有78人,占比为19.7%;其他作者均发表了1篇论文,占比为80.3%。根据普赖斯定律计算得出该领域发文量大于或等于3篇的作者为高产作者,经统计共有27人,如表1所示。其中:发文量最高的作者为黄如花和邓李君,发文量均为11篇;其次为张群和杨文建,发文量均为10篇。利用UCINET 6.0软件中的Netdraw可视化软件,对发文量为2篇以上作者的共现情况进行分析,网络图谱中的节点越大说明该作者的发文量越多,连线代表作者之间具有合作关系,连线越粗则代表两者合作发文量越多。在社会网络分析中,度中心性是指与某个节点直接相连的节点数量,与一个节点连接的节点数量越多,则该节点的度中心性越强。黄如花、孟祥保、张群是具有较高度中心性的作者,与其他作者的合作关系较为紧密。该领域作者之间的合作关系多为23人的表1 高产作者发文量情况序 号作者姓名发文量/篇序 号作者姓名发文量/篇序 号作者姓名发文量/篇1黄如花1110程结晶519初景利32邓李君1111沈玖玖520彭奇志33张群1012郝媛玲421叶兰34杨文建1013张娟422李建霞35胡卉914陈媛媛423郭倩36吴鸣815刘慧424刘玉敏37孟祥保716张路路425秦小燕38沈婷婷617刘敏426宋甲丽39王春迎518柯平327王维佳32023年第19卷第3期66合作;3人以上的合作关系较少;仅有黄如花、王春迎、周志峰、范冰玥一组4人合作,他们共合作发表了2篇论文。由此可见,该领域的研究存在的小规模合作关系较多,大规模且持续稳定的合作关系较少。2.3 发文机构分析该领域研究的发文机构共涉及223个一级或二级单位,表2列出了发文量在4篇及以上的机构名称。发文量最多的机构是武汉大学信息管理学院,发文量为15篇;其次为中国科学院文献情报中心,发文量为14篇。发文量较多的机构主要集中在高校院系和高校图书馆。本研究利用可视化软件制作的发文机构共现知识图谱可以看出,东南大学图书馆、武汉大学信息管理学院、中国科学院文献情报中心等机构的度中心性较高,与其他机构的连线数量较多,这说明这些机构的合作关系较为紧密,处于中心位置。从合作机构类型上来看,存在跨机构合作、同一机构内部的跨部门合作,如北京大学信息管理系、武汉大学信息管理学院、中山大学资讯管理学院之间的合作关系,东南大学图书馆、中山大学资讯管理学院、中山大学图书馆之间的合作关系等,但不同院系之间的跨学科合作关系还比较缺乏。表2 研究机构发文量情况序 号机构名称发文量/篇序 号机构名称发文量/篇1武汉大学信息管理学院1510武汉大学信息资源研究中心62中国科学院文献情报中心1411南开大学商学院53四川外国语大学图书馆1212吉林大学管理学院54中山大学资讯管理学院1113南昌大学管理学院55东南大学图书馆1114黑龙江大学信息管理学院46中国科学院大学1015中山大学图书馆47江南大学图书馆916南京晓庄学院图书馆48重庆第二师范学院图书馆817华东师范大学图书馆49上海大学图书馆718南京大学信息管理学院42.4 发文期刊分析国内发表数据素养研究的期刊数量为31种,刊载2篇以上论文的期刊有22种,占比为71.0%,其他为刊载1篇论文的期刊,占比为29.0%。刊载6篇以上论文的期刊共有18种,共计257篇,占发文总数的93.8%,可以看作该领域的主要文献源。其中,图书馆理论与实践 图书馆学研究 图书与情报 图书情报工作图书馆工作与研究排在前5位,期刊发文量占比为44.9%,接近于半数,因此这5种期刊可以看作数据素养研究较为核心的文献源。3 研究热点分析3.1 高频关键词共现分析关键词是作者对一篇论文核心观点的主观理解和概括,对关键词进行分析可以从一个侧面了解该领域的主要研究主题。在选取的274篇文献中,共有关键词506个,总词频为1 168次。本研究通过对关键词进行整理,将词义相同的词进行合并,例如将“大学图书馆”和“高校图书馆”统称为“高校图书馆”、“新文科建设”和“新文科”统称为“新文科”、“慕课”和“MOOC”统称为“MOOC”。经过整理,在所有关键词中,词频大于或等于4次的关键词共有41个(见表3),词频共计601次,占总词频的51.5%,因此,这41个关键词可以看作该领域的主要研究主题。通过分析可知,该领域的研究分布较为集中,超过半数的研究主题分布在少数关键词上。高频关键词代表了近年来国内数据素养研究的热点,但仅对文献中出现频次较高的关键词进行单一的数量统计,难以发现各个关键词之间存在的核心联系,因此还需要进行进一步的关键词共现分析10。利用COOC软件11绘制高频关键词共现矩阵,将矩阵导入UCINET 6.0软件中的Netdraw软件,绘制国内数据素养研究的高频关键词共现图谱。将排名前30位的高频关键词作为整个网络结构的节点,节点的大小和位置代表了该节点在整个网络中的地位和作用:节点越大、位2023年第19卷第3期67基于社会网络分析的国内数据素养研究现状与展望李亚设置越居中则代表该节点越处于核心地位。各关键词之间的共现关系由节点的连线来表示,连线越粗代表两个关键词的共现关系越强。首先,在整个网络中占据主导地位的词汇包括数据素养、高校图书馆、数据素养教育、大数据、图书馆,说明当前该领域研究主要以对大数据背景下图书馆数据素养教育的研究为主,尤其是高校图书馆的数据素养教育受到较多关注。其次,处于网络中较为靠近中心位置的词汇包括信息素养、数据管理、数据服务、科学数据,说明这些研究领域也与数据素养研究密切相关。最后,处在网络边缘的节点包括数据馆员、学科馆员、新文科、智慧图书馆、MOOC、数字人文等,这些关键词代表了该领域的进一步发展方向,说明在未来的研究中,关于数据馆员的培养、新文科背景下的数据素养教育、通过MOOC平台开展在线数据素养教育等方面的研究可能会受到较多的关注。3.2 关键词聚类分析聚类分析把关联密切的关键词聚在一起形成类团,是一种将研究对象分为相对同质的群组的统计分析技术。首先利用COOC软件生成高频关键词相异矩阵(见表4),再将相异矩阵导入SPSS软件进行系统聚类分析,生成关键词聚类树状图。共现频次较高的关键词表3 数据素养研究高频关键词分布情况序 号关键词词频/次序 号关键词词频/次序 号关键词词频/次1数据素养12015数据管理829文献计量52高校图书馆7916科学数据服务730智慧图书馆53数据素养教育5217数据素养能力731大学生44大数据4618素养教育732元素养45信息素养3819新文科633数据共享46图书馆3320知识图谱634人才培养47科学数据2021学科馆员635指标体系48数据服务1322数字人文536影响因素49科学数据素养1223数据生命周期537大数据时代410信息素养教育1124用户教育538教育模式411MOOC1125科研数据服务539能力412数据馆员1126科研数据540图书馆服务413科研数据管理1027教育541可视化分析414科学数据管理9