温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
人工智能
产业
综述
报告
亿欧智库人工智能产业综述报告2017年4月Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告后续内容的更新和添加会在此页作出提醒。内容更新2Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告机器不但能够延长人的手和脚,代替人的某些体力活动,还能够延长人脑,代替人的某些思维活动。自从计算机出现以来,这已经是越来越明显的事实了,往后沿着一个方向,在发展计算机技术的同时,还逐步形成了一种人工智能的新技术。它包括但不仅限于模仿人的大脑中枢神经系统建立起了神经网络模型来处理现实社会复杂多变的问题。它指导计算机下棋、证明定理、制定策略和决策,用机器对文字、声音、和图像进行识别,用自然语言(人的语言)直接和计算机联系,研制具有识别、分析和综合、执行等功能的机器等各个方面。从人类建立起需要指导控制才能运行的计算机,到计算机拥有可以自己去学习的能力,对学术界来说是一个质的飞跃,对产业界来说带来的是有形的生产力的经济利益。我们相信2016年是人工智能发展的一个重要拐点,是更快更强的计算力和爆炸式增长的数据库将人工智能推到了镁光灯之下,不夸张地说,人工智能已经成为了流行文化甚至是政治话语的前沿,但我们也推测,很有可能人工智能在下一个路口就步入了舆论的冬季。而这份报告的目的是希望在那个给予承诺又让人失望的周期到来之前,以研究的心态回顾人工智能发展的路线图、冷静审视技术的本质、挖掘技术落地具体市场的机遇和挑战,为人工智能的持续发展出一份力。序言出品方:亿欧智库;作者:吴妙芸;指导支持:由天宇;其他支持:杜博伟、王超、陈茁、缑凯莉等;3Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告目录CHAPTER 1回顾人工智能发展的路线图1.1 人工智能的定义1.2 神经网络的发展历程;1.3 深度学习的机遇和挑战;CHAPTER 2冷静审视人工智能技术的本质2.1 计算机视觉技术;2.2 语音识别技术;2.3 自然语言理解技术;CHAPTER 3人工智能技术落地具体市场的机遇和挑战3.1 为什么优先关注医疗、金融和出行这三个领域的AI+;3.2 智能医疗;3.3 智能投顾;3.4 无人驾驶;附录亿欧智库:主要中国企业核心AI人才图谱(216人)4Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告CHAPTER 1回顾人工智能发展的路线图1.1 人工智能的定义;何谓人工智能;追溯人工智能的产生和发展;人工智能、机器学习和深度学习;1.2 神经网络的发展历程;从神经元模型到深度学习;1.3 深度学习的机遇和挑战;5Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告人工智能发展路线图何谓人工智能;广义的人工智能就是创造出能像人类一样思考的机器,它不仅是科幻电影喜闻乐见的主题,更是科学极客们的终极梦想,是技术狂不切实际、异想天开的代名词。而狭义的人工智能,美国斯坦福大学人工智能研究中心尼尔逊教授就给下了这样一个定义:“人工智能是关于知识的学科,是怎样表示知识以及怎样获得知识并使用知识的科学。从人工智能实现的功能来定义是智能机器所执行的通常与人类智能有关的功能,如判断、推理、证明、识别学习和问题求解等思维活动。这些反映了人工智能学科的基本思想和基本内容,即人工智能是研究人类智能活动的规律。若是从实用观点来看,人工智能是一门知识工程学:以知识为对象,研究知识的获取、知识的表示方法和知识的使用。”追溯人工智能的产生和发展;1943年最早的人工神经元模型被提出;1956年达特茅斯会议上一群科学家的集中讨论,引出了人工智能这个概念,也是这一年成为了人工智能的元年;1977年在第五届国际人工智能会议上,美国斯坦福大学计算机科学家费根鲍姆教授正式提出了知识工程概念,随后各类专家系统得以发展,大量商品化的专家系统被推出市面,但发展的好景不长,因为该计算机系统没有什么学习能力,或者说学习能力非常有限,满足不了科技和生产提出的新要求,于是继专家系统之后,机器学习便成了人工智能的又一重要领域。人工智能、机器学习和深度学习三者关系;回顾人工智能发展的路线图深度学习机器学习人工智能人工智能、机器学习和深度学习三者之间的关系,后者属于前者。时下火热的深度学习是机器学习下的一分支,其所搭建的多层神经网络,其实是由最早的神经元模型演化而来的。1.1 人工智能的定义何谓人工智能;追溯人工智能的产生和发展;人工智能、机器学习和深度学习;1.2 神经网络的发展历程;从神经元模型到深度学习;1.3 深度学习的机遇和挑战;6Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告神经网络的发展历程;早在1943年计算机发明之前便有了第一个M-P神经元模型,在这个模型中,神经元接收来自N个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比对,然后通过激活函数产生神经元的输出。1958年提出的单层感知机是在M-P神经元上发展得来,有输入和输出两层神经元搭建而成,能解决“与、或、非”这些简单的线性问题,却在1969年遭遇人工智能奠基者之一的Minsky写书的质疑。单层感知机确实解决不了异或问题,但堆叠成的多层感知机(Multilayer Perception,MLP)可以,也就是我们说的多层神经网络,它将一步完成不了的东西给拆分成多步完成,在这中间利用算法从大量训练样本中学习出统计规律,从而对未知事件进行预测。所谓深度学习,狭义地说就是很多层的神经网络,在若干的测试和竞赛上,尤其涉及语音、图像等复杂对象的应用中,深度学习技术取得了优越的性能。以往机器学习想要在人工智能发展路线图M-P神经元模型;单层感知机;多层感知机;深度学习神经网络(Deep Neural Network,DNN);卷积神经网络(Convolutional Neural Network,CNN);递归神经网络(Recurrent Neural Network,RNN);1.1人工智能的定义何谓人工智能;追溯人工智能的产生和发展;人工智能、机器学习和深度学习;1.2神经网络的发展历程;从神经元模型到深度学习;1.3深度学习的机遇和挑战;回顾人工智能发展的路线图7Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告应用中取得好的性能,对使用者的要求门槛较高,而深度学习技术基于复杂模型之上,使用者只要下功夫去“调参”,调好参数性能往往就好,对使用者的门槛大大的降低了。深度学习的机遇;深度学习是机器学习的一种,本质上都是在统计数据,并从中归纳出模型。实际上,神经网络存在已久,深度学习的多层模型比起浅层模型,在参数数量相同的情形下,深层模型具有更强的表达能力。如果将大数据比作水、计算力比作输送水的工具,是GPU等采用水管来替代勺子更高效地增大了灌水量(提高运算速度),是深度学习算法训练出来的深层模型这个容器加大了水量的装载力,极大地提高了效率。这样的工程方法产生之后,深度学习搭建的深度神经网络成为了工业界实用的武器,并且在若干领域都带来了里程碑式的变化。深度学习的挑战;深度学习是近20年以来曝光度最高的技术,但它不是人工智能的全部创新,它的创新发生在上世纪80年代末,也就是人工智能的多层神经网络技术热潮,当时之所以没有成功,甚至还经历了10多年的寒冬期,背后的原因是因为当时没有像现在大量的数据、也没有现在高性能的计算力做大量的运算。1.1人工智能的定义何谓人工智能;追溯人工智能的产生和发展;人工智能、机器学习和深度学习;1.2神经网络的发展历程;从神经元模型到深度学习;1.3深度学习的机遇和挑战;大数据GPU等使运算加快浅层模型到深层模型回顾人工智能发展的路线图8Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告另外深度学习也存在缺陷。中国科学院数学与系统科学研究院数学研究所研究员、复旦大学教授陆汝铃在为机器学习一书撰写序言的时候提及,一是深度学习的理论创新还不明显;二是因为目前的深度学习只适用于神经网络。再有就是它的不可解释性,深度学习从原始的输入信息到提取特征到输出信息的过程是一个黑盒子,缺乏可解释性。有业界人士认为,“如何将深度学习过程和人类已经积累的大量高度结构化知识融合,发展出逻辑推理甚至自我意识等人类的高级认知功能,是下一代深度学习的核心理论问题“。但也有人认为“人工智能不是人类智能,机器超过人脑并不需要模仿人脑,正如人消灭大型猛兽并不是通过更有力气或更锋利的爪子。人工智能最大的作用不是模仿人类,而是把人类智力劳动中可机械化的部分机械化。再者机器的长处是个体之间的教育成本极低,交流速度极快。人和人之间交流信息的速度只有几个比特每秒,机器比这快几百万倍。机器根本不需要和人拼计算能力,只要拼进化速度,在自然选择中必然会出现一种杀手机器。”1.1人工智能的定义何谓人工智能;追溯人工智能的产生和发展;人工智能、机器学习和深度学习;1.2神经网络的发展历程;从神经元模型到深度学习;1.3深度学习的机遇和挑战;回顾人工智能发展的路线图9Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告CHAPTER 2冷静审视人工智能技术的本质2.1 总览人工智能技术图谱;2.2 计算机视觉技术;什么是计算机视觉?计算机视觉识别技术的分类;计算及视觉技术的识别流程;计算机视觉技术模式图和对应企业图;2.3 语音识别技术;什么是语音识别?语音识别流程;语音识别技术模式图和对应企业图;2.4 自然语言理解技术;什么是自然语言理解?自然语言理解的应用:搜索引擎和机器翻译;10Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告如前文所述,基础支撑层的算法创新发生在上世纪80年代末,是大数据和计算力将人工智能推到镁光灯之下,而建立在这之上的基础技术便是计算机视觉、语音识别和自然语言理解,机器试图看懂、听懂人类的世界、用人类的语言和人类交流,研究人类智能活动的规律。人工智能发展路线图总览人工智能技术图谱;冷静审视人工智能技术的本质其它机器学习大数据数据挖掘各行业/场景的一手数据计算力云计算GPU/FPGA等硬件神经网络芯片算法机器学习学习方式深度学习监督学习、无监督学习、强化学习、迁移学习等神经网络算法框架TensorFlow、Caffee、Theano、Torch、DMTK等框架手势控制语音识别自然语言理解人机交互语音交互语音翻译语音助理搜索引擎机器翻译计算机视觉动态识别字符识别图像识别情境感知计算人脸识别基础支撑层技术层人工智能2.1 总览人工智能技术图谱;2.2 计算机视觉技术;2.3 语音识别技术;2.4 自然语言理解技术;11Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告计算机视觉技术(Computer Vision);什么是计算机视觉?根据科普中国撰写的对计算机视觉的定义,这是一门研究如何让机器“看”的科学,更进一步的说,是指用计算机代替人眼对目标进行识别、跟踪和测量的机器视觉,并进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉 VS 机器视觉;计算机视觉更关注图像信号本身以及图像相关交叉领域(地图、医疗影像)的研究;机器视觉则偏重计算机视觉技术工程化,更关注广义上的图像信号(激光和摄像头)和自动化控制(生产线)方面的应用。冷静审视人工智能技术的本质“人的大脑皮层的活动,大约70%是在处理视觉相关信息。视觉就相当于人脑的大门,其它如听觉、触觉、味觉那都是带宽较窄的通道。视觉相当于八车道的高速,其它感觉是两旁的人行道。如果不能处理视觉信息的话,整个人工智能系统是个空架子,只能做符号推理,比如下棋、定理证明,没法进入现实世界。计算机视觉之于人工智能,它相当于说芝麻开门。大门就在这里面,这个门打不开,就没法研究真实世界的人工智能。”朱松纯,加州大学洛杉矶分校UCLA统计学和计算机科学教授2.1 总览人工智能技术图谱;2.2 计算机视觉技术;什么是计算机视觉?计算机视觉识别技术的分类;计算及视觉技术的识别流程;计算机视觉技术模式图和对应企业图;2.3 语音识别技术;2.4 自然语言理解技术;12Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告计算机视觉识别技术的分类;物体识别分为“1 VS N”对不同物体进行归类,以及“1 VS 1”对同类型的物体进行区分和鉴别;物体属性识别,结合地图模型让物体在视觉的三维空间里得到记忆的重建,进而进行场景的分析和判断;物体行为识别分为3个进阶的步骤,移动识别判断物体是否做了位移,动作识别判断物体做的是什么动作,行为识别是结合视觉主体和场景的交互做出行为的分析和判断。计算机视觉的识别流程;计算机视觉识别流程分为两条路线:训练模型和识别图像。训练模型:样本数据包括正样本(包含待检目标的样本)和负样本(不包含目标的样本),视觉系统利用算法对原始样本进行特征的选择和提取训练出分类器(模型);此外因为样本数据成千上万、提取出来的特征更是翻番,所以一般为了缩短训练的过程,会人为加入知识库(提前告诉计算机一些规则),或者引入限制条件来缩小搜索空间。识别图像:会先对图像进行信号变换、降噪等预处理,再来利用分类器对输入图像冷静审视人工智能技术的本质物体识别字符识别人体识别物体识别物体属性识别形状识别方位识别物体行为识别移动识别动作识别行为识别训练样本正样本负样本特征选择和提取分类器分类结果输入图像扫描窗口特征选择和提取训练知识库缩小搜索空间2.1 总览人工智能技术图谱;2.2 计算机视觉技术;什么是计算机视觉?计算机视觉识别技术的分类;计算及视觉技术的识别流程;计算机视觉技术模式图和对应企业图;2.3 语音识别技术;2.4 自然语言理解技术;13Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告进行目标检测。一般检测过程为用一个扫描子窗口在待检测的图像中不断的移位滑动,子窗口每到一个位置就会计算出该区域的特征,然后用训练好的分类器对该特征进行筛选,判断该区域是否为目标。计算机视觉技术模式图和对应企业图;目前世界上图像识别最大的数据库,是斯坦福大学人工智能实验室提供的ImageNet,冷静审视人工智能技术的本质应用层计算机视觉主导的应用静态内容识别搜索变革(以图搜图/电商搜图购物)照片管理(标签分类检索/美颜特效)智能安防动态内容识别直播监管视频平台营销三维分析计算机视觉与其他技术结合的综合应用+自然语言处理+人机交互+生物科技VR/AR无人驾驶医疗影像技术层字符识别人脸识别视频识别合合信息、拍发票、拍医拍等;旷视科技、云从科技、依图科技、深醒科技等;Video+、Viscovery等;基础支撑层训练数据计算力算法框架ImageNet等;云计算、GPU/FPGA等硬件加速、神经网络芯片等;TensorFlow、Torch、Caffee、DMTK等;2.1 总览人工智能技术图谱;2.2 计算机视觉技术;什么是计算机视觉?计算机视觉识别技术的分类;计算及视觉技术的识别流程;计算机视觉技术模式图和对应企业图;2.3 语音识别技术;2.4 自然语言理解技术;14Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告针对诸如医疗等细分领域也需要收集相应的训练数据;Google、Microsoft此类科技巨头会面向市场提供开源算法框架,为初创视觉识别公司提供初级算法。语音识别(Automatic Speech Recognition);什么是语音识别?语音识别是以语音为研究对象,通过信号处理和识别技术让机器自动识别和理解人类口述的语言后,将语音信号转换为相应的文本或命令的一门技术。由语音识别和语音合成、自然语言理解、语义网络等技术相结合的语音交互正在逐步成为当前多通道、多媒体智能人机交互的主要方式。语音识别流程;语音识别流程分为训练和识别两条线路。语音信号经过前端信号处理、端点检测等预处理后,逐帧提取语音特征,传统的特征类型包括有MFCC、PLP、FBANK等特征,提取好的特征会送到解码器,在训练好的声学模型、语言模型之下,找到最为匹配的此序列作为识别结果输出。冷静审视人工智能技术的本质端点检测特征选择和提取解码器语音数据文本数据声学模型语言模型MFCCPLPFBANK训练匹配结果输出2.1 总览人工智能技术图谱;2.2 计算机视觉技术;2.3 语音识别技术;什么是语音识别?语音识别流程;语音识别技术模式图和对应企业图;2.4 自然语言理解技术;15Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告语音识别技术模式图和对应企业图;基础层:包含大数据、计算力和算法三块,其中大数据等接入的是相应领域的第三方服务商。机器在识别人类的语音指令后接入、提供相应的服务。诸如影视、电影票、餐饮等;技术层:以科大讯飞为首的语音技术提供商;应用层:传统家居环境中的电视、音箱厂商都给加上了语音识别功能,新增交互方式;还有智能车载采用语音交互让手不离开方向盘提高安全系数;还有搜索厂商基于搜索做出来的语音助手等。冷静审视人工智能技术的本质应用层技术层语音技术提供商科大讯飞、捷通华声、思必驰、云知声、出门问问、声智科技等;基础支撑层数据计算力算法框架第三方服务商(影视、电影票、餐饮、天气、导航等);云计算、GPU/FPGA等硬件加速、神经网络芯片等;TensorFlow、Torch、Caffee、DMTK等;智能电视智能车载电话呼叫中心智能移动终端智能家居语音助手2.1 总览人工智能技术图谱;2.2 计算机视觉技术;2.3 语音识别技术;什么是语音识别?语音识别流程;语音识别技术模式图和对应企业图;2.4 自然语言理解技术;16Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告自然语言理解(Natural Language Understanding);什么是自然语言理解?自然语言理解即文本理解,和语音图像的模式识别技术有着本质的区别,语言作为知识的载体,承载了复杂的信息量,具有高度的抽象性,对语言的理解属于认知层面,不能仅靠模式匹配的方式完成。自然语言理解的应用:搜索引擎+机器翻译;自然语言理解最典型两种应用为搜索引擎和机器翻译。搜索引擎可以在一定程度上理解人类的自然语言,从自然语言中抽取出关键内容并用于检索,最终达到搜索引擎和自然语言用户之间的良好衔接,可以在两者之间建立起更高效,更深层的信息传递。自然语言理解技术在搜索引擎中的应用;冷静审视人工智能技术的本质搜索引擎技术层关联型问题是非型问题个性化建模场景化建模分析语句需求和类型、聚合技术(呈现结果)、自动文摘技术;实体(属性信息)识别、实体对齐、实体归一化;大数据挖掘技术;知识图谱关系网络深度问答技术推荐引导基础支撑层算法计算力互联网、移动互联网带来的社交数据、知识分享数据、社区/论坛数据等;2.1 总览人工智能技术图谱;2.2 计算机视觉技术;2.3 语音识别技术;2.4 自然语言理解技术;什么是自然语言理解?自然语言理解的应用;17Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告自然语言理解技术在机器翻译中的应用;事实上搜索引擎和机器翻译不分家,互联网、移动互联网为其充实了语料库使得其发展模态发生了质的改变。互联网、移动互联网除了将原先线下的信息(原有语料)进行在线化之外,还衍生出来的新型UGC模式:知识分享数据,像维基百科、百度百科等都是人为校准过的词条,噪声小;社交数据,像微博和微信等展现用户的个性化、主观化、时效性,可以用来做个性化推荐、情感倾向分析、以及热点舆情的检测和跟踪等;社区、论坛数据,像果壳、知乎等为搜索引擎提供了问答知识、问答资源等数据源。另一方面,因为深度学习采用的层次结构从大规模数据中自发学习的黑盒子模式是不可解释的,而以语言为媒介的人与人之间的沟通应该要建立在相互理解的基础上,所以深度学习在搜索引擎和机器翻译上的效用没有语音图像识别领域来得显著。冷静审视人工智能技术的本质机器翻译技术层语料处理技术模型处理技术翻译方法语料质量评估、语料分类与选择、语料挖掘技术、时效性资源挖掘;分布式模型、动态更新技术、用户个性化模型、模型过滤和压缩;领域自适应技术、翻译与搜索结合、枢轴语言技术、多策略翻译技术;基础支撑层算法计算力互联网、移动互联网带来的社交数据、知识分享数据、社区/论坛数据等;2.1 总览人工智能技术图谱;2.2 计算机视觉技术;2.3 语音识别技术;2.4 自然语言理解技术;什么是自然语言理解?自然语言理解的应用;18Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告CHAPTER 3人工智能技术落地具体市场的机遇和挑战3.1 我们优先关注了医疗、金融和出行这三个市场的AI+;为什么是这三个领域?3.2 AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾的现实,重视AI但远未委以重任;投资者对于投资顾问的需求;AI赋能投资顾问的具体应用;智能投顾的理想遭遇现实;3.4 无人驾驶距离面市,中间还横着监管体系的问题;什么是无人驾驶汽车;自动化是未来移动出行趋势的一支;无人驾驶的监管体系问题;19Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告一项新技术的发展会遵循Gartner曲线经历舆论期望的膨胀,而后破灭继而步入稳定,但人工智能却不同,人们对它的期望曲线忽上忽下,当下人工智能的火热随时都可能在下一个路口再次步入舆论的冬季。不同于舆论环境的忽上忽下,人工智能无法交付一个惊雷般改变生活的产品,相反它会以一个连续的、进步的方式继续更好的发展,新技术的落地正在按部就班的推进。为什么优先关注了医疗、金融和出行这三个领域的AI+?追溯本质来讲,人工智能是一项降本增效、赋能产业升级的工具,不同的是它在各行各业所受到的关注度或过度的追捧,或悄无声息。总体来看,亿欧智库在“医疗”、“金融”和“出行”这三个领域都看到了降本增效的可能性,看到了这些市场的变革关乎着普罗大众的迫切需求,也看到这些变革的背后所带来的“引一发而动全身”的潜力效应。人工智能技术落地具体市场的机遇和挑战期望值时间3.1 为什么优先关注这三个领域;3.2 智能医疗;3.3 智能投顾;3.4 无人驾驶;20上图来自知乎北冥乘海生Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告“引一发而动全身”的潜力效应;因为医疗这里有着最迫切的变革需求;医疗是一个民生领域,而“医改”年年是热点词,却年年令人无奈,互联网+医疗推行至今,医改收效微乎其微。如今,能否通过人工智能+医疗助力变革,成了群雄逐鹿的新浪潮。因为金融业是服务业,对其它行业来说充当着润滑油的作用;统计局数据显示,2015年中国金融业增加值的GDP占比为8.5%,2016年上半年的数据则上升到9.2%。由于GDP是国民经济所有行业增加值的加总,所以,金融业增加值占GDP之比这一指标的含义非常简单,表明全社会有多少资源和多少回报流向了金融业。金融业是服务业,对其他行业来说它充当着润滑油的作用,润滑油不足机器运转不畅、磨损大,润滑油过多则会造成打滑、空转。因为移动性是城市的命脉,也是城市生活的基本需求;数据显示堵车每年给洛杉矶造成的损失高达230亿美元,在这基础之上,城市化和人口增长的趋势还将推动城市平均人口密度至少增长30%。为此,我们可以预见人们对移动的需求翻番,将引发更大的交通拥堵,带来更低效率的移动出行,事关个人权利、事关经济流通、也事关保护环境。人工智能技术落地具体市场的机遇和挑战看个病九成时间都在排队!没钱,生不起病今年工资会不会涨?3.1 为什么优先关注这三个领域;3.2 智能医疗;3.3 智能投顾;3.4 无人驾驶;21Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告CHAPTER 3.2人工智能技术落地医疗市场的机遇和挑战3.2 AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;22Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告医疗领域存在的问题;目前医疗领域存在、最迫切需要解决的问题是什么?新浪微博针对这个问题发起了一项调查,最终结果是由3933人参与单选投票得出,一定程度上反映了民众所认为的、医疗改革迫切需要解决的问题。如上图所示,在3933人的随机投票结果中显示,有39.6%的声音吐槽“看病贵”,其次是“医疗资源不平衡”、“医患关系”、“基层医疗”等。医疗行业的基本参与者是医院(医疗资源)、医护人员和患者,前者在这篇文章不予以重点讨论,后二者关心的无非是“看病方不方便、贵不贵”、“今天能不能准时下班”、“今年工资会不会涨”这些朴素的诉求。AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;23Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告挖掘这些诉求更深层次的背后会发现,医疗现状存在着如下的问题。从供给方看,医疗资源配给不足,医护人员高水平稀缺还分布不均;对于医护人员来说,高水平的医生稀缺,还大部分集中在一线城市,除却人才的医疗资源也是配给跟不上需求。国家卫生计生委主任李斌在出席十二届全国人大五次会议的记者发布会的时候,就表示,“目前存在优质的医疗资源总量相对不足,分部不均衡的主要问题”,“促进优质资源下沉、重心下移,首要就是通过改革来建立分级诊疗制度”。从需求方看,“看病难”、“看病贵”;民众的主要诉求的是缩短看病时间和降低误诊,相信“看个病九成时间在排队”的感受人皆有之,当然这里排除了部分服务好的私立医院。高水平医生少医生资源分布不均医疗资源配给跟不上需求缩短看病时间降低误诊医疗资源医护人员患者高水平医护人员中水平医护人员低水平医护人员一线城市二、三线城市三线以下城镇乡村不同水平医护人员数量分布高水平医护人员的地域分布AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;24Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告AI赋能于医疗,是一项降本增效的工具;在医疗领域,AI发展其实有一些年头了,是深度学习时机的到来让人们对AI有了新的期盼,无论是期待AI的到来能替换医生,还是诊断出某些疾病,甚至是基于大数据来选择最佳治疗或预测结果。七大类医疗+AI企业;针对医疗领域存在的问题,市面上涌现了一批“医疗+AI”的公司,亿欧智库对其做了定类划分:医学影像类、基因测序类、医疗大数据类、医疗服务类、健康管理类、药品/器械研发类、机构信息化类,如上图所示。以下为分类界线的划定:机构信息化类:这类公司主要通过数据监测和分析的方式,帮助医疗机构提升运营效率和诊疗效果,降低支出成本。医疗大数据类:这个分类相对比较模糊,因为实际上其他几个类型都离不开医疗大数据。不过,这类公司相比而言更加注重数据本身的研究和分析。比如鼎鼎大名的Flatiron,就是搭建肿瘤大数据平台、累计肿瘤患者数据,并通过对数据的研发和分析服务临床、科研、新药以及患者治疗。高水平医生少医生资源分布不均医疗资源配给跟不上需求缩短看病时间降低误诊医疗资源医护人员患者机构信息化类医疗大数据类药品/器械研发类健康管理类精准医疗类医学影像类医疗服务类医疗现状存在的问题AI对应的解决方案AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;25Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告药品/器械研发类:基于大数据和人工智能技术,让数据的计算模拟药品/器械研发过程,来帮助药企/器械厂商缩短研发周期,降低研发成本。医学影像类:基于人工智能、深度学习技术,帮助医生更快更准确的读取病人的影像数据,以更好的做出判断,目前计算机已经可以完全自动地阅读心电图,半自动地阅读宫颈刮片图,和独立承担许多实验诊断学的测试项目。医疗服务类:通常所理解的临床诊断辅助系统,包括早期筛查、诊断、康复,手术风险监测,用药安全等,而且会分不同领域,比如血液、睡眠、神经、心理等。精准医疗类:基于对人体本身的数据化,并通过对这些数据的分析提供精准治疗,基因测序的数据和通常的医疗大数据含义不一样,但是放到未来人工智能和精准医疗在基因测序这个环节上,也许是连通的。健康管理类:这里主要把对个人的健康管理和以个人用户为主的可穿戴设备,都归入其中。这类公司主要用是用户个人的健康数据来预测疾病风险、提供健康管理方案。这是医疗+AI少有的to C类别。上图为亿欧智库收集的对应分类的部分相关“医疗+AI”企业。AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;26Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告医学影像是“医疗+AI”距离商业化最近的板块;在以上7大分类当中,医学影像是业界普遍认为距离商业化最近的板块。一方面因为影像数据是所有医疗数据中标准化程度最高的;另一方面,医学影像受关注度高,医学影像在现代医学、生物工程和计算机信息技术的推进下,已然成为与外科、内科并列的三大治疗手段,许多重大疾病,如癌症和某些心脏病,通过高端的医学影像设备,可以在病变早期发现,不仅可以提高治愈机会并且控制了医疗费用。高精度多模态医学成像技术早已成为全球各大科研机构和跨国公司角逐的热点。医学影像市场早已是个千亿级规模的市场。AI在医学影像中的具体应用;技术层应用层语音识别、图像识别、自然语言理解、知识图谱、数据挖掘技术、机器学习计算机辅助检测人体解剖学的自动标识和解析看疾病看解剖结构AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;27Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告从周翔博士的人工智能的医疗应用:商业化和工业化之随想一文中,亿欧智库总结出(如上图):AI赋能于医学影像设备两只眼睛,一只专注于看疾病,这也就是传统的CAD(Computer Aided Detection,计算机辅助检测)领域,另一只眼睛将专注于看解剖结构,ALPHA(Automatic Landmarking And Parsing Of Human Anatomy,人体解剖学的自动标识和解析)。ALPHA:基于机器学习的对人体解剖结构的自动检测在医学成像领域得到了广泛的应用。CT和MRI机器能够从预扫图中自动找到各种解剖结构,然后非常精准的对目标结构(比如说大脑)进行成像,同时减少对相邻敏感器官(比如说眼角膜)的不必要的伤害,还能跟踪器官运动,以及提供各类测量,如图上图。ALPHA工具帮助大大提高成像的质量、速度、一致性和重现性:一致性指的是指的是不同的技术人员扫描同一病人出来的图像应该是一样的。重现性的一个例子是,比如说六个月以后所照的膝盖磁共振图片应该与六个月之前的图片正好切在同一个解剖平面上,这样才能看清楚六个月的治疗的真实效果,并帮助放射医生更快更好地处理分析图像和撰写报告。CAD:类比于自动驾驶中L2到L3会有事故责任主体的转变,在医学影像中也有。不过CAD计算机辅助检测算法大部分时间担当的是“第二读者”的角色,算法仅仅提供帮助辅助,医生仍需要对图像的采集和分析负全部责任。到了L3级AI成为“第一读者”,也是“唯一读者”的时候,就成为要对事故负责任的主体。据周翔博士在其文章中介绍的,目前在心电图监测、宫颈涂片和一些病理图像自动分析的任务中AI早已扛起了主要责任。“医生只需AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;28Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告要审核一下那些算法找到的可疑的病变区域。计算机将分析所有的胸部X射线图像,并且直接向临床医生指出哪一些人可能有病变,而把那些看上去正常的健康的人直接送回家。大数据不能共享、医疗信息未能标准化,医疗智能化之路依然崎岖;尽管AI能着实助力医疗的改变,但解决医疗的问题是一项长线战役。基层的诉求是“加工资、快下班”、“看病贵、看病难”,从长期来看诉求得不到满足的原因出在“大数据没能共享”、“医疗信息未能标准化”,如图9(上图)。由于医院系统的封闭性、数据的敏感性,医院之间并不互相承认结果,导致了大数据的不足,再加上医疗信息标准化的缺失,可以说在很长的一段时间内,若没有解决大数据共享和医疗信息标准化这两个难题,医疗智能化之路依然崎岖。大数据共享;创业者需要大量数据,而医院和患者又要守住数据。医院:创业者需要大量共享数据,而医院和供应商为了利益更需要坚守壁垒,阻止AI赋予医疗降本增效功能,但医疗智能化之路依然崎岖加工资,快下班看病难,看病贵大数据共享+医疗信息标准化这里不讨论因素诉求层问题层根本问题层AI3.1 为什么优先关注这三个领域;3.2 智能医疗;医疗领域存在的问题;AI赋予医疗,是一项降本增效的工具;但医疗智能化之路依然崎岖;3.3 智能投顾;3.4 无人驾驶;29Artificial Intelligence Summary Report亿欧智库:人工智能产业综述报告共享。多年来庞大的利益链,使得数据共享化面临难以打破的僵局。如何打破各方利益,保障数据安全性,将是医疗智能化的一个重要前提。患者:另外即便数据打通了,对于患者来说,数据安全性的保障又是另外一个难题。没有患者希望自己的数据被人泄露。医疗信息标准化;医疗信息标准化方面,医院的数据大部分没有形成标准化,即便有电子病历,内容上也是医生主观输入,而非系统化标准语言。如果在医疗领域无法形成各类信息的标准化,精准医疗等无异于纸上谈兵。就跟玩游戏打怪一样,要满足诉求层的期盼,实现大数据共享和医疗信息标准化中间横着重重关卡,在医疗智能化的道路上,AI尽管能发挥着实在的降本增效的