分享
半导体电子通信行业:人工智能无所不在-20190225-国金证券-64页.pdf
下载文档

ID:3047706

大小:4.51MB

页数:65页

格式:PDF

时间:2024-01-18

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
半导体 电子 通信 行业 人工智能 无所不在 20190225 证券 64
-1-敬请参阅最后一页特别声明 市场数据市场数据(人民币)人民币)市场优化平均市盈率 18.90 国金半导体指数 3252.34 沪深 300 指数 3439.61 上证指数 2755.65 深证成指 8440.87 中小板综指 8379.04 相关报告相关报告 1.全年衰退,最糟已过,进入另一波上行周期-全年衰退,最糟已过,.,2019.2.18 2.5G 东风已至,VR/AR 乘势起航-5G 东风已至,VR/AR 乘.,2019.2.15 3.芯片封测行业 2018 年业绩遇冷,2H19下半年恢复可期-封测.,2019.2.1 4.【半导体周报】下半年半导体有望复苏,可折叠手机带动 OLED-.,2019.1.31 5.【国金计算机周报】政策的快速推动和实 质 性 改 善,板 块 吸 引 力 和 发.,2018.4.1 樊志远樊志远 分析师分析师 SAC 执业编号:执业编号:S1130518070003(8621)61038318 罗露罗露 联系人联系人 人工智能人工智能无所不在无所不在 投资建议投资建议 人工智能人工智能是未来无所不在的工具是未来无所不在的工具:人工智能平台(包括芯片,模组,算法,云训练/推理)不算新型应用,而是整合半导体,通信,软件及云/边缘运算/设备电子端后成为各种提升物联网应用效能的人工智能工具平台,这就像我们常用的微软Office 软件。云端芯片巨头英伟达早在 2016 年,公司就累计了 7 大应用领域及19,439 客户使用其深度学习的服务工具,配合半导体,算法和之前在云端大数据的深度学习训练和推断的数据库,来执行更佳的智能推理。投资建议投资建议:国内重点关注公司华为海思(半导体设计),寒武纪(设计),海康威视(安防 AI系统),商汤(算法软件),伊图(算法软件)行业观点行业观点 AI 半导体半导体 10倍数增长可期倍数增长可期半导体篇半导体篇:目前人工智能芯片仍多是以 GPU,张量处理器,或 FPGA+CPU 为主,但未来 ASIC 将在边缘运算及设备端遍地开花,及逐步渗透云端市场,预估全球 AI 云端半导体市场于 2018-2025 年 CAGR 应有37%,边缘运算及设备端半导体市场于 2018-2025 年 CAGR 应有 249%,远超过全球半导体市场在同时间 CAGR 的 5%,占整体份额从 2018 年的 1%到 2025年的 10%,超过 10 倍数增长可期。谁能引领国内人工智能芯片产业突围谁能引领国内人工智能芯片产业突围?有今年中国科创板融资平台的加持,国内的半导体公司将陆续推出人工智能 ASIC 抢先机。而华为海思因为有强大的财力来开发 10 纳米及以下产品,负担 EDA 软件,验证,光掩膜成本的蹿高,加上强大的设计团队及对系统的认知,预计将引领国内 AI 芯片行业突围;而比特大陆因为深谙 IP,芯片,模块,到生态系的竞争,不排除其反而率先推出有竞争力的云端人工智能的解决方案模块;寒武纪目前有较佳的设计团队及较充裕的估值融资能力来陆续推出边缘运算端及云端推理的人工智能芯片。AI 让电子行业插上腾飞的翅膀让电子行业插上腾飞的翅膀电子篇电子篇:近年来,AI技术得以大幅度提升,应用场景也越来越多。2017 年人工智能市场中,计算机视觉位居第一,占比达到37%,语音第二,达到 22%,而在计算机视觉应用中,安防占比高达 68%,基于计算机视觉开发的人脸解锁、人像美颜功能在 AI 手机应用中渗透率分别高达75与 90。我们看好 AI 未来在安防、智能手机、可穿戴设备、智能家居等方面的应用爆发,优质龙头公司为海康威视及大华股份。政策政策,技术技术,资本资本三轮驱动三轮驱动系统平台系统平台战略篇战略篇:全球主要国家均将 AI 作为未来主导性战略,在国家竞争版图中,中国在 AI 领域强在应用层,基础和技术层是相对短板。AI将重塑 ICT产业生态,芯片和软件平台是产业制高点,但从应用看,AI 在安防、自动驾驶等重点场景应用加速,云化是 AI 发展前提,计算机视觉、智能语音是 AI市场两大应用方向,但 AI视觉将最具商业化价值赛道。行业已进入群雄逐鹿阶段,头部算法企业如商汤、伊图横向建立平台,垂直领域龙头如海康、大华纵向深耕行业,科技巨头如阿里、华为立体式打造全产业生态。风险提示风险提示 除了国内算法软件公司及美国 AI芯片大厂外,未来 24 个月,我们看不出来国内 AI 芯片大厂能摆脱亏损;美国商务部工业安全局可能对其 11 项 AI 和机器学习技术列入出口管制清单;AI ASIC 大厂对各种应用系统认知不足,安防语音自驾系统公司不愿分享其系统设计机密。2528287032133555389842404583180222180522180822181122国金行业 沪深300 2019 年年 02 月月 25 日日 创新技术与企业服务研究中心创新技术与企业服务研究中心 半导体/电子/通信行业 买入(维持评级)行业深度研究行业深度研究 证券研究报告 1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4-2-敬请参阅最后一页特别声明 内容目录内容目录 一、人工智能无所不在半导体篇.6 1、人工智能平台到底是工具还是应用?.6 2、人工智能会渗入各领域应用无所不在.7 3、三种主流人工智能演算法.8 4、到底哪种人工智能芯片将成云计算的主流?.11 5、哪种人工智能芯片将成边缘运算及设备端的主流?.17 6、谁能引领国内人工智能芯片产业突围?.20 二、AI 让行业应用插上腾飞的翅膀电子应用篇.27 1、AI让安防升级换代,催生更多应用场景.27 A、稳健发展中的安防产业.27 B、AI技术助力安防行业智能化升级.27 C、智能安防才刚进入初级阶段,AI占比低于 1%,未来大有可为.32 D、安防 AI面临的三大挑战.34 E、AI+安防使用技术.35 F、AI安防场景应用.36 G、2018 年安防 AI发展情况.37 H、AI+安防发展趋势.38 2、智能手机 AI应用势如破竹.39 A、AI视觉给手机带来新方向.39 B、解放双手,AI语音助手发展在路上.41 3、智能穿戴 钱途无量.42 A、可穿戴设备保持快速成长.42 B、可穿戴 AI市场增速更快.42 C、蓝牙耳机有望会成为私人AI小秘.43 4、安防AI让智能家居正式迈入智慧家居.43 A、智能音箱,智能家居设备的入口.44 B、家庭智能安防渐成刚需.44 三、AI信息服务的蓝海已至系统平台战略篇.45 1、政策、技术、资本三轮驱动.45 A、全球主要国家均将人工智能作为未来主导性战略,美中领跑.45 B、技术变革促使 AI突破应用瓶颈,推动产业应用爆发.46 C、资本涌入加速产业成熟,AI+、视觉、大数据等领域成为投资热点.47 D、人工智能重塑产业生态,芯片和软件平台是产业制高点.48 2、AI是全新的生产要素及工具,AI+行业将成为普遍商业模.49 A、高数字化行业将优先实现人工智能的应用.49 1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-3-敬请参阅最后一页特别声明 B、安防、自动驾驶是当前和未来人工智能重点应用领域.50 3、计算机视觉、智能语音是 AI 时代入口,中国初创龙头企业具备全球竞争力 51 A、计算机视觉:AI行业最具商业化价值的赛道.51 B、中短期核心竞争壁垒是技术和产品能力,长期是生态构建能力.54 C、头部算法企业横向建立平台,垂直领域龙头纵向深耕行业,科技巨头立体式打造全产业生态。.55 D、智能语音:产业进入爆发期,看好对话式人工智能发展.55 4.领先初创企业介绍:商汤、旷视、依图、云从、云知声.57 A、商汤:AI算法提供商龙头,平台化战略赋能公司和行业.57 B、旷视:优秀的人脸识别平台企业,战略进军 IoT.59 C、依图:注重实战,业务聚焦于安防和医疗.59 D、云从:AI国家队,银行、机场人脸识别产品第一大供应商.60 E、云知声:云端芯战略,重点布局家居、车载及医疗三大领域.61 四、投资建议.61 五、风险提示.62 1、中美贸易及关税战是否趋缓?.62 2、国内 AI芯片大厂能否摆脱亏损?.62 3、禁售人工智能新兴技术?.62 4、系统设计机密不愿分享:.62 图表目录图表目录 图表 1:人工智能的多样性.6 图表 2:人工智能云,边缘运算,设备端半导体及行业市场营收预估.6 图表 3:人工智能技术工艺的演化.8 图表 4:卷积输入及输出特征贴图及最大池.9 图表 5:循环神经机器翻译.10 图表 6:深度神经网络.11 图表 7:深度学习.11 图表 8:各种人工智能半导体优缺点比较.12 图表 9:人工智能云端系统图形处理芯片面积.12 图表 10:人工智能半导体市场预测以不同芯片种类来分类.13 图表 11:英伟达云端人工智能芯片 V100 及系统 DGX-1 规格比较表.14 图表 12:赛灵思BlackLynx与 GPU在机器学习推理解决方案的比较.15 图表 13:谷歌张量处理器 TPU 3 vs.TPU 2.16 图表 14:各公司云端人工智能芯片比较表.17 图表 15:谷歌的智能推断边缘运算端的解决方案模块(System-on-module,SOM).18 1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-4-敬请参阅最后一页特别声明 图表 16:谷歌的智能物联网整体解决方案.18 图表 17:智能推断边缘运算端的解决方案模块比较表.19 图表 18:人工智能深入学习从云到设备端.20 图表 19:集成电路设计成本飙高.21 图表 20:华为云,边缘运算,及设备端的芯片解决方案.22 图表 21:寒武紀 16nm MLU100 云端 AI 芯片.23 图表 22:地平线 Matrix 1.0 SAE L3/L4 无人驾驶平台解决方案模块.24 图表 23:比特大陆损益表.25 图表 24:比特大陆挖矿机芯片制程工艺.25 图表 25:设备端人工智能芯片每瓦算力功耗比.25 图表 26:中国安防产业稳健成长.27 图表 27:AI融入安防产业链.28 图表 28:智能安防云边结合示意图.28 图表 29:海康威视 AI Cloud 核心理念.29 图表 30:智能安防产业链.30 图表 31:AI+安防产业图谱.30 图表 32:人工智能安防涉及的主要算法.31 图表 33:安防监控四类主要芯片.31 图表 34:GPU在智能安防的应用.32 图表 35:AI+安防典型落地应用产品.32 图表 36:2018 年中国 AI摄像机建设逻辑与发展概况.33 图表 37:中国智慧安防市场规模预测.33 图表 38:2017 年安防厂商视频监控业务收入占比.34 图表 39:2018 年安防厂商视频监控业务收入占比.34 图表 40:AI技术在手机应用中的渗透率.40 图表 41:计算机视觉应用全景图.40 图表 42:OPPO R17 Pro 的 AR 测量.41 图表 43:17-22 年各类可穿戴设备出货量.42 图表 44:17-22 年各类可穿戴设备出货量占比.42 图表 45:全球可穿戴 AI市场预测.43 图表 46:AirPods 出货量预测.43 图表 47:全球智能家居发展情况.44 图表 48:中美各 AI板块企业数量分布.45 图表 49:中美各 AI板块企业融资金额分布(亿元).45 图表 50:中国在人工智能领域的专利数呈现爆发式增长态势.46 图表 51:人工智能技术不断突破.46 图表 52:2018 年 Gartner 人工智能技术成熟度曲线.47 图表 53:全球人工智能投融资笔数分布(2013-2018Q1).47 图表 54:中国 AI企业融资规模持续走高.48 1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-5-敬请参阅最后一页特别声明 图表 55:中国 AI各领域融资金额分布.48 图表 56:ICT 产业正在跨界和重构,人工智能芯片成为新战略控制点.48 图表 57:全球 ICT 巨头 AI布局一览.49 图表 58:AI为行业带来增值.50 图表 59:AI为行业带来利润提升.50 图表 60:不同行业 AI技术应用程度.50 图表 61:自动驾驶汽车产生海量数据.51 图表 62:华为 MDC 600.51 图表 63:全球 AI企业应用技术方向分布.52 图表 64:中国 AI企业应用技术方向分布.52 图表 65:计算机视觉架构及各层级玩家示意.53 图表 66:2017 年中国计算机视觉应用市场份额.53 图表 67:2018 年全球计算机视觉行业市场结构.54 图表 68:AutoML 工作原理(红色部分自动完成).54 图表 69:AutoML 内部工作机制.54 图表 70:近几年语音识别准确率变化.56 图表 71:头部智能语音初创企业首款专用芯片发布梳理.56 图表 72:对话式人工智能在智能家居、随身设备、智能车载的渗透率.57 图表 73:商汤业务布局梳理.58 图表 74:商汤近年对外重要投资梳理.58 图表 75:2015-2017 三大顶级会议论文收录数.58 图表 76:算法和算力支撑公司应用拓展.58 图表 77:旷视对外投资梳理.59 图表 78:FRVT(2018)比赛结果(部分).60 1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-6-敬请参阅最后一页特别声明 一、一、人工智能无所不在人工智能无所不在半导体篇半导体篇 1、人工智能平台到底是工具还是应用?人工智能平台到底是工具还是应用?人工智能平台(包括芯片,模组,软件)在一般人看起来像是一种新型应用,但在我们看来人工智能芯片在整合软硬件后将成为各种物联网应用的提升效能工具平台,这就像我们常用的微软 Office 软件,微软 Office 软件是我们在办公室应付各种应用的生财工具,因此人工智能平台除了被广泛利用在云端大数据的深度学习训练和推断外,我们认为人工智能平台也将出现在各式各样的应用端的边缘设备,从英伟达公布的数字来看,早在 2016 年,公司就累计了 7 大领域(高等教育,发展工具,互联网,自驾车,金融,政府,生命科学)及 19,439客户使用其深度学习的服务工具,配合软件和之前在云端大数据的深度学习训练和推断的数据成果库,来达到帮助使用者或取代使用者来执行更佳的智能判断推理。图表图表1:人工智能的多样性:人工智能的多样性 来源:英伟达,国金证券研究所 虽然目前人工智能芯片仍多是以昂贵的图形处理器(GPU),张量处理器(Tensor Processing Unit),或 现 场 可 编 程 门 阵 列 芯 片 配 合 中 央 处 理 器(FPGA+CPU)为主,来用在云端的深度学习训练和推理的数据中心,但未来特定用途集成电路(ASIC)将在边缘运算及设备端所需推理及训练设备遍地开花,及逐步渗透部分云端市场,成为人工智能芯片未来的成长动能,我们预估全球人工智能云端半导体市场于 2018-2025 年复合成长率应有 37%,边缘运算及设备端半导体市场于 2018-2025 年复合成长率应有 249%(请参考图表),远超过全球半导体市场在同时间的复合成长率的 5%,整体约占全球半导体市场的份额从2018 年的 1%到 2025 年的 10%。图表图表2:人工智能云,边缘运算,设备端半导体及行业市场营收预估:人工智能云,边缘运算,设备端半导体及行业市场营收预估 2017 2018E 2019E 2020E 2021E 2022E 2023E 2024E 2025E CAGR 全球半导体市場(US$bn)412 478 454 477 534 571 588 647 660 5%全球半导体市場(同比)22%16%-5%5%12%7%3%10%2%AI 半导体(US$bn)2 5 10 17 26 38 48 59 69 46%AI 半导体(同比)180%129%108%70%53%46%26%22%18%AI IC 佔全球 IC 份額(%)1%1%2%4%5%7%8%9%10%云端 AI 半导体(US$bn)2 5 8 12 18 24 30 37 44 37%云端 AI 半导体(同比)180%129%69%52%43%34%28%23%19%边缘及设备端 IC(US$bn)0 2 5 8 15 18 22 25 249%边缘及设备端 AI IC(同比)190%147%79%73%24%19%16%1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-7-敬请参阅最后一页特别声明 AI 行业销售额(US$bn)104 143 192 261 361 490 657 854 1,093 34%AI 行业销售额(同比)76%37%34%36%38%36%34%30%28%来源:Statista,Tractica,Frost&Sullivan,国金证券研究所 2、人工智能会渗入各领域应用无所不在人工智能会渗入各领域应用无所不在 当大多数的产业研究机构把自驾车(Autonomous drive vehicle),虚拟/扩增实境(Virtual Reality/Augmented Reality),无人商店(Unmanned store),安防智能监控(Smart Surveillance System),智能医疗,智能城市,和智能亿物联网(Internet of Things,IoT)分别当作半导体产业不同的驱动引擎,国金半导体研究团队认为其实自驾/电动车,5G,虚拟/扩增实境,无人商店,安防智能监控,智能医疗,智能城市其实都只是人工智能亿物联网的延伸。无人驾驶无人驾驶/电动电动/联网车对半导体的需求爆增联网车对半导体的需求爆增 10 倍倍:虽然全球汽车半导体产业,目前由传统的整合元件制造商(IDM)掌控,但未来很难说,主要是因为先进辅助或自动驾驶系统兴起,人工智能,摄像,传感,雷达芯片公司的出现。像英伟达图形处理器(Xavier,Pegasus 320),谷歌张量处理器(Tensor Processing Unit),英特尔Altera/Mobileye 的 CPU/FPGA/AI解决方案,地平线 L3/L4 自动驾驶(Matrix 1.0 平台,征程 2.0 芯片),高通,联发科,华为海思的 5G 无线通信平台及毫米波雷达,索尼,豪威的传感器,博通及瑞昱的以太网络芯片。尤其是自动驾驶对雷达,摄像头,传感器及芯片的 3 倍增幅;千倍的 3D 视频数据的上传及云端的存储,学习,推理;因无人驾驶车设备及云端建制成本高昂(US$150,000Waymo 车),额外成本必须由广大消费者共同分摊费用较有利,乘坐共享,公交服务业,产品运送的后勤支援业无人驾驶应会领先乘用车市场,而 Waymo/谷歌将带动出租车公交车自动驾驶市场,领先英伟达的自驾乘用车市场(请参阅国金电动,无人驾驶,车联网的三部曲驱动力电动,无人驾驶,车联网的三部曲驱动力的深度报告),依照美国加州DMV(Department of Moter Vehicles)最新公布的资料显示 Waymo 于去年测试的 120 万英里中,每 1000 英里发生解除自驾系统状况频率是 0.09次,运低于前年的 0.179 次,及通用 Cruise 的 0.19 次,苹果的 872 次,及 Uber 的 2860 次;自动泊车、车道偏离检测、无人驾驶的带宽需求,及车内电线费用和重量的不断增加。为了让增加数倍的电子控制单元(ECU)能彼此间快速地沟通,数倍的以太网路节点和转换器芯片需求便随之而来。无人商店及安防智能监控:无人商店及安防智能监控:除了自动驾车联网外,最近风起云涌的无人商店和智能监控,不也是利用大量监控摄像头,配合三维人脸辨识系统,二维码/近场通讯来收集大数据资料,再透过 WiFi/xDSL/光纤传输,将资料送到云端人工智能储存与处理来达到无需柜台人员的无人商店和能随时辨识的视频智能监控,而政府机关可透过此系统来调查人口移动来重新设计城市智能公共交通系统,协寻通缉犯,恐怖分子,失踪人口,及在展场,车站,机场,学校,大型活动场地的安全监护;系统整合业者除可做无人商店外,也可靠着人口动向来预测消费热点(商家必备),人口居住热点(房地产业必备),如果再配合无人商店,线上购物系统,和政府的大数据,系统业者便可更精准的投送广告,发展个人信用评级。类似于自驾车联网,无人店和监控联网系统需要大量并且高清晰度的三维辨识摄像头和芯片,传输系统和芯片,和庞大的云端,边缘运算,及设备端的储存及智能训练及推理的各式高速芯片及软件。智能智能医疗:医疗:智能医疗系统可利用三维脸部个人辨识来挂号,减少排队时间,让看诊更顺畅。医院可收集资料并整合个人在不同医疗院所的所有医疗纪录;医生可利用人工智能数据平台辅助做更精准的医疗判断,减少重复用药的浪费和对病人的副作用,医院可利用此大数据资料做更深入的医学研究,数家政府医院应先抛砖引玉,带头做整合。智能亿物联网:智能亿物联网:1.空污,水污染化空污,水污染化学感测物联网学感测物联网:政府是否应利用强制安装并定期检验各式气体/液体的物联网化学感测器在每部汽、机车和工厂排污管道上,再透过大量的低耗能无线通讯将资料上传到云端储存和处理,并透过人工智能来监测空污,水污来收取空污或水污税;2.身份识别证明联网身份识别证明联网:大型互联网企业像谷歌(Googl US),百度(Baidu US),腾讯(00700.HK),或海康威视(002415.SZ)为何不能发展三维脸部个人辨识智能系统来整合所有的线上线下购物,启动驾驶,银行转帐/汇款/提款,进入手机/电脑/应用1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-8-敬请参阅最后一页特别声明 App,和政府机关办事所需要的身份证明。您可否想过你现在要纪录多少密码,多少使用者名称,身上带着多少付款软体,银行卡,信用卡,钞票,居民身分证,交通卡,驾照,护照,居民健康卡,电梯卡,加油卡,金融社保卡,大卖场会员证,和各式通行卡;3.同步翻同步翻译连网译连网:目前先进智能芯片/软体的语音辨识速度太慢和不够精准的理解与翻译,应是语言同步翻译机仍未大卖的主因,但透过更高速的智能芯片,无线通讯芯片和更庞大的语音数据库来训练云和端的人工智能的推理反应,相信未来国际多种语言的零障碍沟通将指日可待;4.人工智能教人工智能教师和消费机器人:师和消费机器人:当把强大的人工智能导入到人工智能教师和消费机器人联网物中,透过不断的反覆学习,这不但可提升学生的教育水平和兴趣,未来都能解决老人及残障人士的健康照顾,清洁,饮食,娱乐,保全等需求,减少后代的负担及外佣虐老事件,也明显能提升老人和残障人士的寿命和生活品质。3、三种主流人工智能演算法三种主流人工智能演算法 最早的人工智能出现及运用在 19501980 年代,接着转换到 1980-2010年机器学习,从 2010 年以后,随着各种演算法 CNNs,RNNs,DNNs 等图影像视觉学习,辨识,推理的普及,让深入人工智能深入学习的突飞猛进。深度学习是人工智能和机器学习的一个子集,它使用多层人工神经网络在诸如对象检测,语音识别,语言翻译等任务中提供最先进的准确性。深度学习与传统的机器学习技术的不同之处在于,它们可以自动学习图像,视频或文本等数据的表示,而无需引入手工编码规则或人类领域知识。它们高度灵活的架构可以直接从原始数据中学习,并在提供更多数据时提高其预测准确性。人工智能的深度学习最近取得的许多突破,例如谷歌 DeepMind 的 AlphaGo 及更强大的AlphaZero 陆续 在围 棋,西洋 棋类 比赛 夺冠,谷 歌 Waymo,英 伟达 的Xavier/Pegasus 320,及 Intel/Mobileye 的 Eye 4/5 自动驾驶汽车解决方案,亚马逊的 Alexa,谷歌的 Google Assistant,苹果 Siri,微软的 Cortana,及三星的Bixby 智能语音助手等等。借助加速的深度学习框架,研究人员和数据科学家可以显着加快深度学习培训,可以从数天或数周的学习缩短到数小时。当模型可以部署时,开发人员可以依靠人工智能芯片加速的推理平台来实现云,边缘运算设备或自动驾驶汽车,为大多数计算密集型深度神经网络提供高性能,低延迟的推理。图表图表3:人工智能技术工艺的演化:人工智能技术工艺的演化 来源:英伟达,国金证券研究所 卷积神经网络卷积神经网络 CNNs(Convolutional Neural Networks):卷积神经网络(CNN)是建立在模拟人类的视觉系统,并透过图影像分类模型的突破,也将是,主要来自于发现可以用于逐步提取图影像内容的更高和更高级别的表示。CNN是将图像的原始像素数据作为输入,并学习如何提取这些特征,并最终推断它们构成的对象。首先,CNN 接收输入特征图:三维矩阵,其中前两个维度的大小对应于图像的长度和宽度(以像素为单位),第三维的大小为 3(对应于彩色图像的 3 个通道:红色,绿色和蓝色)。CNN 包括一堆模块,每个模块执行三个操作。举例而言,卷积将 3x3 过滤1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-9-敬请参阅最后一页特别声明 贴图的 9 个条件(0,1)套用(先乘后求和以获得单个值)在 5x5 输入特征贴图的 9 个像素特征上,而得出 3x3 全新的卷积输出特征贴图。在每次卷积操作之后,会采用最大池演算法(Max pooling),CNN 对卷积特征贴图进行下采样(以节省处理时间),同时仍保留最关键的特征信息,最大池化是要从特征贴图上滑动并提取指定大小的图块(2x2),对于每个图块,最大值将输出到新的特征贴图,并丢弃所有其他值。在卷积神经网络的末端是一个或多个完全连接的层,完全连接的层将一层中的每个神经元连接到另一层中的每个神经元。它原则上与多层感知器神经网络(multi-layer perceptron neural network(MLP)类似,他们的工作是根据卷积提取的特征进行分类,CNN 可以包含更多或更少数量的卷积模块,以及更多或更少的完全连接层,工程师经常试验要找出能够为他们的模型产生最佳结果的配置。总之,CNN 专门于图影像处理如自动驾驶汽车,安防,人脸辨识,及疾病图像辨识解决方案。图表图表4:卷积输入及输出特征贴图及最大池:卷积输入及输出特征贴图及最大池 来源:谷歌,国金证券研究所 循环神经网络循环神经网络 RNNs(Recurrent Neural Network):RNN是一类人工听觉及说话的神经网络,具有记忆或反馈回路,可以更好地识别数据中的模式。RNN 是常规人工神经网络的扩展,它增加了将神经网络的隐藏层送回自身的连接-这些被称为循环连接。循环连接提供了一个循环网络,不仅可以看到它提供的当前数据样本,还可以看到它以前的隐藏状态。具有反馈回路的循环网络可以被视为神经网络的多个副本,其中一个的输出用作下一个的输入。与传统的神经网络不同,循环网络使用他们对过去事件的理解来处理输入向量,而不是每次都从头开始。当正在处理数据序列以进行分类决策或回归估计时,RNN 特别有用,循环神经网络通常用于解决与时间序列数据相关的任务。不同于 CNN专门于图影像处理,循环神经网络的应用包括自然语言处理,语音识别,机器翻译,字符级语言建模,图像分类,图像字幕,股票预测和金融工程。机器翻译是指使用机器将一种语言的源序列(句子,段落,文档)翻译成相应的目标序列或另一种语言的矢量。由于一个源句可以以许多不同的方式翻译,因此翻译基本上是一对多的,并且翻译功能被建模为有条件而非确定性。在神经机器翻译(NMT)中,我们让神经网络学习如何从数据而不是从一组设计规则进行翻译。由于我1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-10-敬请参阅最后一页特别声明 们处理时间序列数据,其中语境的上下文和顺序很重要,因此 NMT 的首选网络是递循环神经网络。可以使用称为注意的技术来增强 NMT,这有助于模型将其焦点转移到输入的重要部分并改进预测过程。举两 RNN 的例子,为了跟踪你的自助餐厅主菜的哪一天,每周在同一天运行同一菜的严格时间表。如周一的汉堡包,周二的咖喱饭,周三的披萨,周四的生鱼片寿司和周五的意大利面。使用 RNN,如果输出生鱼片寿司被反馈到网络中以确定星期五的菜肴,那么 RNN 将知道序列中的下一个主菜是意大利面(因为它已经知道有订单而周四的菜刚刚发生,所以星期五的菜是下一个)。另一个例子是如果我跑了 10 英里,需要喝一杯什么?人类可以根据过去的经验想出如何填补空白。由于 RNN的记忆功能,可以预测接下来会发生什么,因为它可能有足够的训练记忆,类似这样的句子以水结束以完成答案。图表图表5:循环神经机器翻译:循环神经机器翻译 来源:谷歌,国金证券研究所 深度神经网络深度神经网络 DNNs(Deep Neural Network):DNN 在视觉,语言理解和语音识别等领域取得了关键突破。为了实现高精度,需要大量数据和以后的计算能力来训练这些网络,但这些也带来了新的挑战。特别是 DNN 可能容易受到分类中的对抗性示例,强化学习中遗忘任务,生成建模中的模式崩溃的影响以及过长的运算时间。为了构建更好,更强大的基于 DNN 的系统,是能否有效地确定两个神经网络学习的表示何时相同?我们看到的两个具体应用是比较不同网络学习的表示,并解释 DNN 中隐藏层所学习的表示。设置的关键是将 DNN中的每个神经元解释为激活向量,神经元的激活矢量是它在输入数据上产生的标量输出。例如,对于 50 个输入图像,DNN 中的神经元将输出 50 个标量值,编码它对每个输入的响应量。然后,这 50 个标量值构成神经元的激活矢量。因为深度神经网路的规模(即层数和每层的节点数),学习率,初始权重等众多参数都需要考虑。扫描所有参数由于时间代价的原因并不可行,因而小批次训练(微型配料),即将多个训练样本组合进行训练而不是每次只使用一个样本进行训练,被用于加速模型训练。而最显著地速度提升来自 GPU,因为矩阵和向量计算非常适合使用 GPU实现。但使用大规模集群进行深度神经网路训练仍然存在困难,因而深度神经网路在训练并列化方面仍有提升的空间。1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-11-敬请参阅最后一页特别声明 图表图表6:深度神经网络:深度神经网络 来源:Deep Cognition,国金证券研究所 4、到底哪种人工智能芯片将成云到底哪种人工智能芯片将成云计算的计算的主流?主流?深度学习是一种需要训练的多层次大型神经网络结构(请参考图表),其每层节点相当于一个可以解决不同问题的机器学习。利用这种深层非线性的网络结构,深度学习可以从少数样本展现强大的学习数据集本质特征的能力。简单来说,深度学习神经网络对数据的处理方式和学习方式与人类大脑的神经元更加相似和准确。谷歌的阿法狗也是先学会了如何下围棋,然后不断地与自己下棋,训练自己的深度学习神经网络,更厉害的阿法零(AlphaZero)透过更精准的节点参数,不用先进行预先学习就能自我演化训练学习。深度学习模型需要通过大量的数据训练才能获得理想的效果,训练数据的稀缺使得深度学习人工智能在过去没能成为人工智能应用领域的主流算法。但随着技术的成熟,加上各种行动、固定通讯设备、无人驾驶交通工具,可穿戴科技,各式行动、固定监控感测系统能互相连接与沟通的亿物联网,骤然爆发的大数据满足了深度学习算法对于训练数据量的要求。图表图表7:深度学习:深度学习 来源:英伟达,国金证券研究所 训练和推理所需要的神经网络运算类型不同。神经网络分为前向传播(Forward algorithm)其中包括输入层,隠藏层,输出层和后向传播(Backward algorithm)主要指的是梯度运算,两者都包含大量并行运算。训练同时需要前向和后向传播,推理则主要是前向传播。一般而言训练过程相比于推理过程计算量体更大。云端人工智能系统透过海量的数据集和调整参数优化来负责训练和推理,边缘运算终端人工智能设备负责推理。推理可在云端进行,也可以在边缘运算端或设备端进行。等待模型训练完成后,将训练完成的模型(主要是各种1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-12-敬请参阅最后一页特别声明 通过训练得到的参数)用于各种应用。应用过程主要包含大量的乘累加矩阵运算,并行计算量很大,但和训练过程比参数相对固定,不需要大数据支撑,除在云端实现外,也可以在边缘运算端实现。推理所需参数可由云端训练完毕后,定期下载更新到应用终端。图表图表8:各种人工智能半导体优缺点比较:各种人工智能半导体优缺点比较 CPU GPU FPGA TPU/ASIC 优点 通用性最高 适合深度学习训练 适合深度学习推理 可完全定制 一般用途 适用于云计算 较低功耗,低延迟,半定制 耗电量低 广泛应用于数据中心的云计算 并行运算性能及通用性高 适合不断变化的工作量 性能高 缺点 不适合并行运算 耗电高,单位成本高 耗电高,浮点速度较 GPU 慢,布线不易 研发期长,初期开发成本高,通用性差 代表企业 英特尔,超威 英伟达,超威 赛灵思,Lattice,英特尔/Altera 谷歌,亚马逊,华为海思,寒武纪,比特大陆,阿里巴巴,百度 来源:Frost&Sullivan,国金证券研究所 在深度学习半导体领域里,最重要的是数据和运算。谁的晶体管数量多,芯片面积大,谁就会运算快和占据优势。因此,在处理器的选择上,可以用于通用基础计算且运算速率更快的 GPU 迅速成为人工智能计算的主流芯片,根据美国应用材料的公开资料(请参考图表),英伟达的人工智能逻辑芯片配合英特尔的中央处理器服务器芯片面积达 7,432mm2,是不具人工智能的企业用和大数据服务器的八倍或谷歌专用张量处理器人工智能服务器的三倍多,存储器耗用面积(32,512mm2)是其他服务器的三倍以上。可以说,在过去的几年,尤其是2015 年以来,人工智能大爆发就是由于英伟达公司的图形处理器,得到云端主流人工智能的应用。但未来因为各个处理器的特性不同,我们认为英伟达的图形处理器 GPU 和谷歌的张量处理器仍能主导通用性云端人工智能深度学习系统的训练,可编程芯片 FPGA 的低功耗及低延迟性应有利于主导云端人工智能深度学习系统的推理,而特殊用途集成电路(ASIC)未来将主导边缘运算及设备端的训练及推理,但因为成本,运算速度,及耗电优势,也会逐步侵入某些特殊应用人工智能云端服务器市场,抢下训练及推理运算的一席之地,以下就先列出各种处理器在云端人工智能系统的优缺点:图表图表9:人工智能云端系统图形处理芯片面积人工智能云端系统图形处理芯片面积 1 9 6 0 9 3 9 6/3 6 1 3 9/2 0 1 9 0 2 2 7 1 6:0 4行业深度研究-13-敬请参阅最后一页特别声明 来源:谷歌,微软,脸书,英伟达,应用材料,国金证券研究所 图表图表10:人工智能人工智能半导体市场预测以不同芯片种类来分类半导体市场预测以不同芯片种类来分类 来源:Tractica,国金证券研究所 中央处理器中央处理器 CPU:X86 和 ARM在内的传统 CPU处理器架构往往需要数百甚至上千条指令才能完成一个神经元的处理,但对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得不佳。中央处理器 CPU需要很强的处理不同类型数据的计算能力以及处

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开