温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
国内外
科学
数据管理
共享
国家自然科学基金
启示
周文能
中国科学基金 年开放科学大家谈国内外科学数据管理与共享政策分析及对国家自然科学基金的启示周文能刘云王刚波广东工业大学 生态环境与资源学院,广州 中国科学院大学 公共政策与管理学院,北京 北京理工大学 管理与经济学院,北京 收稿日期:;修回日期:通信作者,:本文受到国家自然科学基金重点国际(地区)合作研究项目(),国家社科基金重大项目()和盖茨基金会资助项目()的资助。摘要本文阐释了开放科学的理念、科学数据共享的理论与实践意义以及科学数据的发展趋势,系统梳理了欧盟框架计划、英国研究与创新署、美国国家科学基金会和国立卫生研究院等主要国家或区域组织科学数据管理与共享的政策演进及做法,分析了我国科学数据管理与共享的政策演进以及国家自然科学基金项目数据管理与共享的现状,按照 科学数据管理办法 的总体要求,借鉴国际经验,结合科学基金项目数据管理的实际和发展需求,提出了改进国家自然科学基金项目数据管理与共享的政策建议。关键词国家自然科学基金;科学数据;管理与共享;政策科学数据是科学研究重要的知识产出成果,也是科学研究赖以发展的基础保障,在当今大数据时代,科学数据已成为国家重要的战略性科技资源。加强科学数据管理与开放共享是提高科技资源利用效率、提升科技创新能力的重要手段。科学数据管理和共享体系能力建设直接关系到整个国家科技创新能力和创新效率。近 多年来,主要国家高度重视国家科技计划项目的科学数据管理问题,制定相应政策,以加强科研项目的数据管理、促进开放共享。美 国 国 家 科 学 基 金 会(,)于 年月发布的项目管理指南(,)规定:从 年月 日开始,所有提交到 的项目申请书必须包含一份“数据管理计划”()附件,该计划应详细描述申请者如何管 理 和 传 播 研 究 项 目 所 产 生 的 数 据,包 括:()数据的类型;()数据标准;()数据获取与共享政策;()数据存档与保存计划。所属各科学部也制定了各自专门的数据管理计划规定。美国刘云中国科学院大学长聘教授,公共政策与管理学院副院长、博士生导师。主要研究方 向:科 技 政 策、科 技 评 价、创 新 管理、知识产权管理、数据挖掘。主持国家自科基金重点项目、国家社科基金重大项目、国家重点研发计划专项、国家国际科技合作计划项目、国家 计划前期研究专项等国家级课题 多项,发表学术论文 多篇,出版专著 部,获省部级科技奖项。作为专家组组长或成员参与 国家中长期科学和技术发展规划纲要(年)、国家基础研究、国家科研基地和条件保障能力建设、国家自然科学基金等多项国家科技战略规划的研究、起草和评估。周文能广东工业大学教授,曾任科学技术部基础研究司二级巡视员。主要从事基础研究战略与政策、生态系统对全球变化的响应、野外科学观测数据分析、生物多样性保护与利用等领域研究工作。组织和参与了国家重点研发计划(基础研究部分)、科学数据管理、重大科研设施与仪器开放共享相关管理办法等多项政策文件制订工作,负责推进国家(重点)实验室、国家科学数据共享工程、国家应用数学中心和全国野外科学观测研究台站等国家科研基地发展战略布局与管理,为我国基础科学研究提供了政策保障与支持。发表学术论文 多篇,出版专著部。DOI:10.16262/ki.1000-8217.2023.01.014第 卷第期周文能等:国内外科学数据管理与共享政策分析及对国家自然科学基金的启示 国立 卫 生 研 究 院(,)年制定了 数据共享计划,要求从 年 月日开始,所有向 申请项目经费在 万美元以上的科研人员都须提交一份包括数据共享计划或者数据不共享的说明。在数据共享计划中,申请 者 应 简 要 描 述:()数 据 共 享 的 预 期 进 度;()最终数据集格式;()将要提交的文档;()是否会提供一些分析工具;()是否要求共享者签署数据共享协议;()数据共享方式等。英国七大研究理事会除了工程与自然科学研究理事会外,其他个理事会均制定了相应的数据管理政策,如生物技术与生物科学研究理事会要求研究者提交数据共享计划,包含:数据领域与类型、标准和元数据、与其他数据的关系、二次利用、数据共享的方法、共享限制、数据发布的时间表以及数据格式等,研究者须将出版 物 存 放 在 英 国 公 共 医 学 中 心()。我国科学技术部分别于 年和 年开始试点推行科学数据共享工程和国家科技报告制度,涉及到国家科技计划项目的数据汇交,但是,工作进展一直举步维艰。年月,国务院办公厅印发了 科学数据管理办法,这是我国首次在国家层面出台的科学数据管理办法,该办法对利用政府财政资金资助的各级科技计划(专项、基金等)项目所形成的科学数据提出强制性汇交的要求,由项目牵头单位汇交到相关科学数据中心,实行规范管理、长期保存和共享利用。为落实 科学数据管理办法 和 国家科技资源共享服务平台管理办法 的要求,规范管理国家科技资源共享服务平台,完善科技资源共享服务体系,推动科技资源向社会开放共享,科学技术部、财政部对原有国家科技基础条件平台开展了优化调整工作,于 年认定了“国家材料腐蚀与防护科学数据中心”等 个国家科学数据中心、“国家重要野生植物种质资源库”等 个国家生物种质与实验材料资源库。尽管近年来我国出台了有关科技计划项目科学数据汇交与管理的指导性文件,但是,迄今国家科技计划包括科学基金项目还未制定可操作性的科学数据管理办法,科技计划项目申请指南均没有明确要求申请者须提交科学数据管理计划,科技计划项目产出科学数据如何汇交到科学数据中心,科学数据中心如何开展规范管理、数据加工保存、数据开放共享等方面的管理制度尚未健全。为适应开放科学发展趋势,借鉴国外科学基金组织的科学数据管理经验,结合我国科学基金项目数据管理的现状及需求,研究提出国家自然科学基金项目数据管理政策建议具有重要的现实意义。关于开放科学与科学数据共享 开放科学运动的兴起 世纪后期以来,学术界发起了一系列旨在克服传统封闭性科学弊端的开放科学运动,倡导“自由、开放、合作、共享”的理念,开放科学促使在知识创造、信息传播、成果共享、知识应用、乃至科研组织和绩效评价等方面出现了新模式、新规则和新机制。欧盟“促 进 欧 洲 研 究 迈 向 开 放 科 学 的 培 训”(,)项目开发了一个开放科学的分类 系 统,旨 在 覆 盖 整 个 开 放 科 学 领 域。研究报告提出,开放科学即开源软件、开放数据、开放获取、开放研究方法、开放同行评议、开放教育资源等一系列的总称,它们也可以称为开放科学在不同阶段的表现形式。其中,开放获取与开放数据代表着开放科学运动的两支重要力量。年 月,经济合作与发展组织(,)发布 使开放科学成为现实 报告指出,网络和在线平台为研究项目、科学文献和大型数据集的组织和发布提供了新的机遇;信息通信技术使得通过收集大规模数据和信息作为科学试验和研究的基础成为可能,使得科学越来越多地被数据所驱动;而在线存储为获取和利用科研信息成为可能。这些都加速了科研人员和领域之间的知识转移,开辟了合作和新研究方法的新途径,导致“开放科学”的快速发展。在全球科技合作日益广泛、各国科技创新组织相互渗透的今天,开放科学越来越上升为一项国家战略。芬兰教育文化部于 年 月发布了 年开放科学与研究路线图(),明确提出芬兰要在 年成为全球开放科研的领先国家。欧盟 提出在欧洲的公共资助研究,要确保科学出版物的开放获取并且促进科学数据的开放获取,试图打造一个基于数字开放理念的科研创新体系。年月,欧盟委员会发布 开放科学的开放基础设施:咨询报告,提出了三方面的行动:建设一个开放、互操作、面向科学数据的信息化基础设施;通过支持开放科学政策来组织欧盟数据空间;鼓励个人参与数字科学的开放团体。欧盟开始要求其资助科研项目的研究数据对公众开放,一些世界级的学术机构,比如欧洲 中国科学基金 年核子研究理事会开始构建开放数据存储库,学术出版商如 和 也开始尝试科研试验数据出版。总之,当今科技正走向开放科学,主要国家、区域组织以及科学组织都在积极推进科技出版物的开放获取和科学数据开放共享。同时,人们也注意到,开放科学既带来机遇,也面临着一系列挑战,如科学数据的开放共享就会涉及到数据所有权与知识产权、隐私、安全性等问题,开放科学政策应促进研究成果和科学数据的开发与再利用,同时应尊重知识产权的所有权,以促使它能够更加合理有效地实施。在任何一种开放科学的框架中,版权都必须得到保护和支持,推荐采用许可授权的方式扩大数字出版内容的使用。含有个人信息的数据集在医疗和社会科学的研究中大多都具有至关重要的作用,因而对个人数据的处理与保护应格外关注,从法律层面和技术支撑上都需要制定一个万全之策。通过信息安全网络系统保证机密信息、敏感数据的安全性,预防不明攻击与外来的有意攻击行为也十分重要。科学数据共享的意义科学数据是具有重要价值的战略性资源,加强科学数据的管理与开放共享是提高科技资源利用效率、提升科技创新能力的重要手段,是开放科学所提倡的重要科研行为,其对于科研个体及团体,甚至公众,均具 有重要意义。早在 年,美国 科学院()就指出,科研数据共享能够强化开放科学需求,对原始结论加以验证与改进,在现有数据的基础上推进新研究,鼓励政策模拟和评估中更合理的使用经验数据,提升数据收集理论与方法,发展理论知识与分析技术,鼓励多角度分析,提供研究培训资源,预防错误数据,帮助研究者克服狭隘观点与自以为是的态度。中美关于科学数据的定义存在一定的差异,但本质是相同的。中国科学技术部 国家科学数据中心建设技术规范 关于科学数据的界定是特指以公益性和基础性为主体的、具有科学研究应用价值的数据资源,包括在观测、监测、调查、试验、实验以及研究等科学技术活动过程中产生的原始性数据,以及按照不同科技活动需求进行系统加工整理的各类数据。美国管理和预算办公室关于科学数据的界定是指科学界所接受并视为验证研究成果所必要的,已经记录下来的事实材料,但不包括以下内容:初步分析、科学论文草稿、未来研究计划、同行评议、与同事的沟通。上述记录下来的材料不包括实物(如实验室标本)。科学数据共享行为则表现为通过多种形式公开发布科学研究数据为他人所用。数据发布形式多样,基于需求的私下数据交换、公开收集和存储数据、将数据发布到公开网站、以期刊论文附件材料形式提供数据等,都可视为科学数据共享。合理的数据共享能够有效减少不同项目、不同主体间存在的重复性数据收集,避免整体层面科研基金不必要的浪费,提高科研效率与资金利用率。从经济学角度看,在给定条件下,科学数据具备公共物品的性质非竞争性与非排他性。即:在确定可以共享的科学数据中,科学数据共享行为的边际成本接近零,也就是说,科学数据共享行为不会影响他人在对科学数据的使用中获得效用;科学数据共享行为不但不会排除他人使用该科学数据,反而会促进他人对该科学数据的使用。再加上科学数据具备的一些诸如一次性高成本投入,共享成本远低于再生产成本等特征,对科学数据的共享使用并不具备明显的负外部性,也不会随着共享使用程度的增加而造成公共资源的拥挤,因此,科学数据共享行为并不会出现公地悲剧的现象,实现科学数据共享能充分利用现有经费,减少无效劳动。同时,对于受限制的科学数据,也可以通过赋予产权的形式加以使用与交换,在一定程度上弥补了受限制科学数据所不具备的公共物品性质,通过产权交易的形式对原始数据生产者进行经济补偿,在尽量不损害原始数据生产者的前提下,推进科学数据共享。对于不能共享的数据,则需要相关法律的完善,做到有法可依,提高侵权成本,切实保障数据所有权持有者、知识产权持有者以及数据隐私涉及者的合法权利。科学数据的发展趋势随着人工智能、大数据、云计算等新一代信息技术的迅猛发展以及在科学研究领域的广泛应用,促使科学研究的范式发生深刻变革,科学数据在科学研究中的作用凸显,其发展呈现以下趋势:()数据密集型科研成为科学发现和研究工作的新特征当今,许多前沿科学领域取得的重大突破和发现都与海量科学数据的全面收集、深入分析挖掘利用密切相关。继实验型科研、理论型科研、计算型科研之后,数据密集型科研已逐渐成为科学发现的重要方式,该研究方式强调以数