温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2021
人工智能
竞赛
白皮书
1000
深度
分析
AIIAxAICT
202204
White Paper of 2021 AI Competition2021人工智能竞赛白皮书数据科学协同平台前言第一章 人工智能竞赛是数字经济创新发展的重要推动方式一、人工智能竞赛是人工智能技术创新、应用发展的重要推动方式,受到各国政府高度重视二、人工智能竞赛是各地人工智能产业创新发展的重要实现方式三、人工智能竞赛为各行业数字化转型创新持续输出动能第二章 人工智能竞赛是敏捷的数据探索与应用创新方式一、数字化转型成本高昂,暗藏诸多风险二、整合关键创新要素,快速实验创新应用三、低耗高效可持续,生态化创新动能不断第三章 人工智能竞赛帮助促进高校的学科交叉与产研融合一、促进高校加强学科建设与学科交叉二、推动科研机构加速产研融合与技术发展第四章 选手眼中的人工智能竞赛一、为什么参加人工智能竞赛二、希望通过参赛收获三、认为竞赛对自己的意义1.自我效能感2.内部满足感3.外部报酬第五章 组织人工智能竞赛的挑战一、对竞赛复杂性的调研结果1.主办方对竞赛有高预期2.参赛者对竞赛有严要求二、人工智能竞赛的运营复杂度详解1.数据科学项目管理,支撑赛事成果有效性2.保障赛事相关方体验需要面面俱到第六章 如何组织一场人工智能竞赛一、人工智能竞赛的关键要素二、人工智能竞赛的必备条件CONTENTS0304050508 1011121417181921222324242425262727283030333738391.贴合实际场景的需求分析和赛题设计2.审慎的数据筹备与质量管控3.科学有效的竞赛成果评价机制4.平衡成本和效率的计算资源管理与配给三、人工智能竞赛的八大保障1.数据脱敏、防泄漏等安全保障2.公平公正严防作弊的竞赛环境3.参赛选手享有流畅的闭环体验4.云端竞赛环境突破本地配置局限5.数据科学平台与赛事管理系统的应用6.即时高效的赛程运营与服务响应7.多种针对性的辅助活动保障8.数据科学人才社区提供人才保障第七章 覆盖多领域的人工智能赛事案例赛事导航一、政府赛事二、科研赛事三、产业赛事四、高校赛事第八章 人工智能竞赛生态版图与竞赛平台和鲸社区阿里云天池华为云大赛平台DataFountainDataCastleKaggle(国外)第九章 人工智能竞赛的五大趋势与展望一、奖金投入意愿攀升,参与规模稳增二、数据红利可期,数据投入姿态积极三、教育投入与日俱增,数据人才能力跃升四、应用场景不断扩散,标杆行业优势初显五、商业数字化趋势渐强,有赖技术创新落地六、人工智能竞赛驱动的创新生态展望附录39404143454547495151535455565758636773788080808181828384858587888991前言数字科技正逐渐渗透到经济、商业、社会生活方式等方方面面,人们对于数据智能时代的来临充满了期待。然而,从现阶段的发展来看,我们距离真正的大数据时代仍有距离,各行各业的数字化转型进程未能如期落地。数据的力量究竟该如何激发?带着这样的疑惑,我们把视角对准了人工智能竞赛这一载体,以期为行业提供启发。通过全面的调研、分析,我们得到了寻找创新路径和探索最佳实践的总结,形成这份人工智能竞赛白皮书分享给大家。全球人工智能竞赛已经历了 20 余年的探索,其发展起点可追溯至 1997 年由国际顶级学术会 议 KDD(Conference on Knowledge Discovery and Data Mining,知识发现和数据挖掘会议)推出的 KDD Cup。此后,一系列国际顶尖学术会议也陆续牵头组织人工智能竞赛。国际顶会人工智能竞赛往往会积极兼顾市场应用的需求,通过与企业、政府机构合作,聚集当下 技术与数据应用中的难点寻求解决思路,不断缩短科研成果与落地应用之间的距离。创立于 2010 年的 Kaggle 作为目前全球最大的数据科学技术分享社区,更是为人工智能竞赛的平台化发 展奠定了模式化基础,其合作伙伴除了 Google、Facebook、Airbnb、Yelp 等互联网时代诞生的巨头,亦不乏 Walmart、Airbus、Genentech 等声名日久的传统行业领头羊。放眼中国市场,人工智能竞赛自 2014 年萌芽以来,数量每年以翻倍之势增加,主导者不乏权威的 科研机构与高校,亦有来自各行各业的领军企业。身担城市管理与民生重任的政务机构也在“大众创业、万众创新”的政策驱动下,开始意识到数据的力量,牵头组织了多场大型人工智能竞赛。人工智能竞赛绝不仅仅只是“主办方发布赛题、传播品牌美誉,参赛者参与开发、收获丰厚奖金”的公关活动。对双方而言,人工智能竞赛已经成为了数字化转型的“云端实验室”,很多领先机构已经把人工智能竞赛当作是他们最佳的“数字化练兵场”、“数字化人才挖掘器”和“数字化生态构建器”。主办方紧跟数据智能的发展趋势,通过挖掘数据价值的场景和树立“数据+算力+人才+算法”的价值闭环,积累数据科学研发的核心能力;参赛选手能够积累如何在真实业务场景中应用先进技术的实际经验,在与众多高手的交流切磋中不断成长。基于这一现状意义,在中国人工智能产业发展联盟(AIIA)的指导下,和鲸科技携旗下中国领先的第三方人工智能竞赛平台“和鲸社区(H)”,联合中国信息通信研究院数据研究中心、北京邮电大学人工智能学院、人工智能开源社区“DataWhale.club”,共同发布2021 人工智能竞赛白皮书,分析全球市场人工智能竞赛发展趋势,提出对人工智能竞赛推动前沿技术落地的创新价值思考,并在业界开源优质人工智能竞赛运营方法论与最佳实践。第一章人工智能竞赛是数字经济创新发展的重要推动方式一、人工智能竞赛是人工智能技术创新、应用发展的重要推动方式,受到各国政府高度重视二、人工智能竞赛是各地人工智能产业创新发展的重要实现方式三、人工智能竞赛为各行业数字化转型创新持续输出动能在国家层面,人工智能竞赛助力数字经济创新发展,突破重点技术瓶颈,推动人工智能产业高质量发展。2017 年 7 月,国务院印发新一代人工智能发展规划的通知,人工智能正式上升至国家战略层面,此后各类关于加快推进数据应用的政策相继出台。可以看到,在国家宏观政策的大力推进和坚实支持下,大数据、云计算以及人工智技术的不断迭代和成熟正在催生日渐规模化、网络化和生态化的内生驱动的生态经济体,其基础都在于借助算法和算力实现对数据价值的洞察。人工智能竞赛活动是人工智能技术创新、产业应用实践、赋能数字经济改革创新的重要方法。通过组织各类人工智能竞赛活动可汇聚各方技术力量,共同研究突破关键技术瓶颈,解决人工智能技术应用落地难点,并提升公众对人工智能技术的认知。我国各省、市贯彻国家创新驱动战略,结合各地人工智能产业特色,举办各类人工智能创新、创业大赛,推动人工智能技术在各行各业的应用创新及成果转化,汇聚人工智能专业人才,促进地方人工智能产业发展。多地举办面向不同人群的人工智能竞赛,当前,全球多个国家发布人工智能国家战略,并在战略中指明应加强人工智能竞赛、合作研讨,实现本国人工智能技术的重大突破,并通过竞赛方式促进人工智能解决方案的开发,恢复本国经济增长。部分国家政府部门牵头组织竞赛,成果解决人工智能相关的科学和工程问题。可以看到,以人工智能竞赛作为载体,以问题为导向,以人才为抓手,汇聚人工智能领域的各界科技创新力量和智慧,在共同推动人工智能+产业发展,加快算法产业化进程中起到重要作用。人工智能竞赛作为人工智能赋能数字经济改革创新的重要手段和窗口,也越来越受到各国的高度重视。覆盖从学生教育、专业技术人员,到行业专家的不同类型竞赛活动,既促进人工智能技术的普及,又面向具有应用价值的场景,探寻技术解决方案。一、人工智能竞赛是人工智能技术创新、应用发展的重要推动方式,受到各国政府高度重视二、人工智能竞赛是各地人工智能产业创新发展的重要实现方式助力政府实践产业落地和建设数据创新生态在“大众创业、万众创新”的号召下,在政府资金、政策和转型决心的支持下,政务部门在大力倡导政务管理数据化、智能化的同时,也成为了有序开放优质公共数据资源、释放公共数据红利的引领者,为建设数据创新生态建设提供着政策支撑和资源支持。如何借助数据科学建设智慧城市,是政务机构面对的重要问题。政务部门的数据积累具有数量更大、来源更多、质量更好、纬度更广等特征,其应用领域遍布城市管理的方方面面。为了探索数据科学在城市管理中的应用可能性,政务机构较为偏好开放性的产品方案赛题。具有明显的行业标签,如教育局、交通局、气象局等,赛题应用场景多与其自身行业标签一致;而没有明显行业标签的政务机构,如人民政府,其赛题场景则非常广泛。人工智能竞赛是数字经济创新发展的重要推动方式 05人工智能竞赛是数字经济创新发展的重要推动方式 06图 1-1 政务部门类赛事主办方的赛题场景分布和技术类型分布数据来源:和鲸科技()经调研统计得出。引用请注明出处。7.2%21.4%31.4%40.0%案例特写:医疗大数据 Datathon产研协作树立医疗数据创新应用的标杆赛事主办方:中国医院协会医学工程专业委员会/中国医疗设备杂志社 2019 年第四届 PLAGH-MIT 医疗大数据 Datathon 于 11 月在北京召开。这一数据实践活动最初由麻省理工大学团队和哈佛医学院团队发起,由中国人民解放军总医院率先将该模式引入国内,旨在融合海量医疗数据物基础上,汇集医疗专家、数据科学家、统计分析师等不同知识背景和专攻技术领域的参与者,利用真实的医疗数据,通过组队协作以项目竞赛的形式解决临床医学面临的众多问题和未满足的医疗需求。通过跨学科合作竞赛的创新模式,Datathon 激活了海量医疗大数据的实用价值,成为数字化创新趋势下高效、敏捷、低耗的练兵场前期的训练营阶段集合了医疗、数据、计算机等不同学科背景的人士,组织进行专业知识的互通交流和学习,快速打通专业壁垒;在正式竞赛阶段,不同背景的参与者通过优势互补的组队构成了数字化创新的基础组织单元,在竞赛环境中协作挖掘医疗数据的应用潜力、探索解答临床实践中遇到的问题,为如何开展医疗大数据研究提供了新思路。迄今为止,医疗大数据 Datathon 已在全球范围内持续组织了 40 余场,历年赛题方向广泛,涉及了影像报告的自动语意分析与信息提取、基于急诊大数据的急性高乳酸血症短期治疗效果预测评估模型构建的研究、以及消化道出血发病风险与气象条件之初步探究等丰富的内容,有效推动了医疗大数据的实践应用落地。Datathon 为医疗研究提供了一个突破时空、地域、文化和学科限制的创新协作平台,项目成果的开源共享和不同观点的激烈碰撞促进了数据和技术在临床医疗领域发了更广泛、更持续的创新价值。科学转化医学期刊评论案例特写:“莱斯杯”全国第二届“军事智能机器阅读”挑战赛军事领域的前沿科研探索赛事主办方:中电莱斯信息系统有限公司 中电莱斯作为我国军事科研的重要力量通过人工智能竞赛积极探索 NLP(自然语言处理)的前沿发展,赛题内容将 NLP技术应用于对真实中文文本段落的阅读理解,要求参赛选手训练的算法模型能够基于对多篇文章的内容定位和深度理解,为测试集中给定的问题找到最优答案。人工智能竞赛将语料库数据、NLP 技术和人才加以串联,并提供了云计算资源和协作开发工具等基础设施,以阅读理解与推理问答的竞赛成果为基础,创造性地探索了 AI 技术在军事场景的应用价值,将有望颠覆以往情报整编工作以人工分析提炼为主的模式,逐步实现由机器替代繁琐、重复性情报整编业务流程。作为中国在军事领域进行 AI 创新探索的标杆案例,该人工智能竞赛也将加强中电莱斯对于中文语料库建设的信心。扫描上方二维码了解更多赛事详情表 1-1 人工智能竞赛对科研机构的价值总结人工智能竞赛的亮点价值融合丰富的资源支持开辟创新的科研价值探索路径释放前沿科研的实用价值树立起前沿科研成果创新应用探索的标杆与工业界进行紧密合作促进了跨学科领域产研交流前沿科研进展科研标杆产研交流数据来源:和鲸科技()经调研统计得出。引用请注明出处。扫描上方二维码了解更多赛事详情人工智能竞赛是数字经济创新发展的重要推动方式 07图 1-2 不同发展周期的