温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
面向
科研
全过程
科学
数据
控制
主体
划分
责任
界定
研究
刘琼
收稿日期:20221207*本文系江苏省教育厅项目“全过程可追溯的科学数据质量控制研究”(项目编号:2021SJA2065);江苏省高校社科联发展专项“面向科研诚信的高校数据诚信治理研究”(项目编号:22GSB012)成果。作者简介:刘琼(1986),女,硕士,馆员,研究方向为科学数据质量研究;刘桂锋(1981),男,博士,研究馆员,研究方向为数据治理研究;聂云贝(1996),女,2020 级硕士研究生。面向科研全过程的科学数据质量控制主体划分及责任界定研究*刘琼刘桂锋聂云贝(江苏大学科技信息研究所江苏镇江212000)摘要:目的/意义 厘清科学数据质量控制的全部主体,探索面向科研全过程的科学数据质量控制的主体责任。方法/过程 引入数据生命周期理论和全面质量管理理论,采用文献调研、网络调查、案例分析和归纳法,对 15 本科学期刊中的数据政策文本、涉及到的科学数据中心,以及国内外“数据质量”相关学术论文进行调研分析。结果/结论 科学数据质量责任主体分为高校科研人员(机构)以及科学数据存储平台、高校图书馆、研究资助机构和专业协会、数据用户四类,各责任主体在不同阶段应承担不同的质量责任。数据质量控制的关键在于围绕各方参与主体,制定管理制度标准,优化流程环节,建立多主体协同的科学数据管理责任机制。关键词:科学数据;数据质量;数据生命周期;全面质量管理;责任主体中图分类号:G301文献标识码:Adoi:103969/jissn10058095202304003esearch on Subject Division and esponsibility Definition of Scientific DataQuality Control for the Whole Process of Scientific esearchLiu QiongLiu GuifengNie Yunbei(Institute of Science and Technology Information Jiangsu University Zhenjiang Jiangsu 212000)Abstract:Purpose/significanceThis paper is to clarify all subjects of scientific data quality control and explore the main re-sponsibilities of scientific data quality control for the whole process of scientific research Method/processThe paper introduces theData Life Cycle Theory and Total Quaility Managment Theory uses literature research network survey case analysis and induction to an-alyze the data policy texts and the scientific data centers involved in 15 scientific journals and the academic papers related to“data qual-ity”at home and abroad esult/conclusionThe responsible subjects of scientific data quality are divided into four categories:univer-sity researchers(institutions)scientific data storage platform university library research funding institutions and professional associa-tions and data users Each responsible subject should bear different quality responsibilities at different stages The key to data qualitycontrol is to formulate management system standards optimize process links and establish a scientific data management responsibilitymechanism of multiagent cooperationKeywords:scientific data;data quality;data lifecycle;total quality management;responsibility subject0引言2021 年 9 月,中华人民共和国数据安全法 出台,提出要“明确数据质量责任主体,完善数据质量核查和问题反馈机制,提升数据质量”。在数据使用者看来,数据质量指在业务环境下数据符合消费者的使用目的,能满足业务场景具体需求的程度1。数据生产者则认为数据是一种特殊的产品,其质量来自于数据生产的过程2。从不同的视角出发,数据质量的标准和要求均有不同。因此,面向科学全过程的视角明确科学数据质量控制的主体及责任十712023 年 4 月Apr 2023情报探索Information esearch第 4 期(总 306 期)No 4(Serial No 306)分有必要。责任主体是指因违反法律、约定或法律规定的事由而承担法律责任的人,包括自然人、法人和其他社会组织。责任主体与数据产品、数据平台、数据用户、数据生命流程等研究视角相比,既能弥补用户视角下数据质量主观性、相对性的局限,又能关注科学数据过程和结果质量的评价。2006 年 12 月,经合组织(OECD)颁布的 OECD 获取公共资助的研究数据的原则与指南 对包括政府、研究人员、研究机构、研究资助机构、图书馆或档案馆、数据中心、出版商、专业协会或学会、用户、企业、社会等在内的众多利益相关者的责任与作用作了界定。相丽玲等根据英国巴斯大学利兹里昂博士(2007)的顾问报告处理数据:角色,权利,责任和关系 总结了科学开放数据各主体之间的责任义务关系3;盛小平等通过解析国际组织科学数据开放共享政策明确了科学数据开放共享中的利益相关者的责任与作用4;王英以国外社会科学数据档案馆政策为样本,划分了政策主体的类别及各自的责任分工5;夏义堃等基于利益相关者理论,归纳和分析了生命科学学科数据管理的责任主体67;目前尚未发现有学者从政策文本、数据中心和主题文献的角度,探析全过程中科学数据质量控制的主体及责任。本文将采用文献调研、网络调查、案例分析和归纳法,选取 15 种科学期刊中的数据政策文本和科学数据中心,结合国内外“数据质量”的学术论文进行调研分析,引入数据生命周期理论和全面质量管理理论,厘清科学数据质量的全部主体,探索科学全过程中科学数据质量控制主体及责任。1理论基础11数据生命周期理论数据生命周期管理(Data life cycle management,DLM)是一种基于策略的方法,用于管理信息系统的数据在整个生命周期内的流动,具体来说就是对数字化资源进行长期保存、提供获取,最终用于支持研究、政策制定等再利用活动8。大部分数据生命周期模型包含相同的阶段,如数据产生或收集阶段、数据处理与分析阶段、数据描述与组织阶段、数据保存或归档阶段、数据发布或共享阶段。聂云贝等通过调研分析国外七个代表性科学机构的数据生命周期过程,将其归纳为数据产生与获取、数据描述与组织、数据处理与分析、数据保存与存储、数据出版与共享五个阶段9,本文将采用这五个阶段进行数据质量控制主体的责任划分。12全面质量管理理论全面质量管理 TQM(Total Quaility Managment)作为传统质量管理的一种形式,从系统论角度出发,将质量作为组织的核心,以全员参与为基础,通过用户满意、本组织全体成员及社会受益而达到长期成功的管理途径10。全面质量管理理论起源于产品领域内的质量管理活动,长期被广泛运用到企业的其他经营管理实践中,近年来逐步应用到科学研究的管理中。方勇分析了全面质量管理在科研管理领域的适用性,提出了应用的原则与方法11;陈芃树等用现代质量管理的思想和方法探讨高校科研实施全面质量管理的有效途径12。在全面质量管理理念中,科学研究被当作一种“产品”,科学数据便是一种数字化的“产品”,而关于“产品”质量的控制与结论,不能仅关注产品本身,还应排除偶然性着眼于科学数据从生产到利用的全过程。因此,根据全面质量管理理论,科学数据质量控制的关键在于全员参与和全过程管理,以及结合数据生命周期理论剖析科学数据质量的全部主体及全过程中各主体的责任。2数据来源本文数据来源主要包括科学数据期刊的“数据政策文本”、科学数据中心的“数据管理政策和流程”和相关主题文献。(1)科学数据期刊的“数据政策文本”科学数据期刊指发表数据论文的期刊,包括纯数据期刊和含有科学数据论文的混合性期刊。数据政策文本包括编辑、专家和主编的评审指南以及数据质量相关政策,如作者提交指南、数据发布和共享政策、数据伦理道德政策、竞争利益指南等。本研究选取不同学科领域影响因子较高的且属于不同出版集团,具有同行评议指南或与数据质量相关政策文件的期刊,最终获得了 15 家来自国内外不同学科不同领域的科学数据期刊(如表 1 所示)。表 1科学数据期刊基本情况数据期刊名称学科领域负责机构出版国家GigaScienceBiologyMedicineOxford University Press美国Earth System Science DataEarth Science Meteorological Atmospheric SciencesCopernicus Publications德国812023 年 4 月情报探索第 4 期(总 306 期)表 1(续)数据期刊名称学科领域负责机构出版国家ZookeysLife sciences MedicinePensoft Publishers保加利亚共和国Data in briefallElsevier荷兰Scientific DataallNature PublicationGroup英国Journal of Open Psychology DataPsychologyUbiquity Press英国Earthquake SpectraEngineering GeologyEarthquake Engineering esearch Institute美国Advances In Atmospheric SciencesAtmospheric Sciences中国科学院大气物理研究所等中国OncologistMedicineAlphaMed Press美国Big Earth DataEarth Science中科院遥感地球所、TaylorFrancis 等中国International Journal of obotics esearchEngineering TechnologySAGE publications美国Frontiers in Marine ScienceEnvironmental SciencesFrontiers 瑞士Geoscience Data JourneyallWileyGroup美国中国科学数据all中国科学院计算机网络信息中心中国全球变化数据学报Earth Science中国科学院地理科学与资源研究所中国(2)科学数据中心科学数据集能否被存储到具有长久保存和公开访问的存储库是稿件评审的重要前提。因此,科学数据期刊提供科学数据存储库推荐列表,以期帮助作者选择合适的数据存储库。本