温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
通信
行业
未来
区块
AI
融合
带来
什么
20190310
证券
19
请仔细阅读本报告末页声明请仔细阅读本报告末页声明 证券研究报告|行业深度 2019 年 03 月 10 日 通信通信 科创未来:科创未来:区块链区块链、AI 和和 5G 融合融合将带来什么?将带来什么?洗尽铅华,回归洗尽铅华,回归 IT 本质。本质。在过去两年,区块链、去中心化概念盛行,而我们却看到相关公链上的 DAPP(Decentralized Application)数量增加而活跃度偏低,游戏、社交等热门方向也未出现里程碑式的应用,市场一直要问,区块链发展的根本动力在哪里?完全的去中心化是否合理?我们认为,区块链仍应放到 IT 发展的大趋势中观察,而 5G 的兴趣、边缘计算的壮大,为此提供了基础设施,在此之上,区块链+AIoT+5G 将会诞生出不一样的互联网世界,此文对区块链的未来发展做些许展望。随着智能手机和物联网智能终端的普及,在区块链、人工智能和随着智能手机和物联网智能终端的普及,在区块链、人工智能和 5G 的推动的推动下,算力、算法和数据三个层面重构互联网商业模式。下,算力、算法和数据三个层面重构互联网商业模式。我们预期,在区块链、AI 和 5G 融合的推动下,互联网将呈现新商业模式。互联网公司对数据的控制力下降,出现算法模式供应商;区块链网络为数据隐私和数据市场治理提供基础协议,用户分享更多数据价值;5G 边缘网络的算力平台将承载更多终端流量,改变先有网络构架,广义智能终端(摄像头、小基站、物联网模组等)计算及存储能力提升;移动终端的硬件构架向 GPU 倾斜。未来算法可以预想呈现模块化、产品化的趋势,互联网公司由数据和网络效未来算法可以预想呈现模块化、产品化的趋势,互联网公司由数据和网络效应的垄断者逐渐蜕变为算法模块的产品商。应的垄断者逐渐蜕变为算法模块的产品商。未来,数据上链、隐私保护下,IT 巨头不必掌握用户的行为数据,只提供算法工具,通过区块链网络得到授权、完成数据使用权的费用支付,训练 AI 机器人。届时,互联网公司也许不再是数据和网络效应的垄断者,蜕变为算法产品化模块的供应商别忘了,区块链网络重塑了数据市场的治理,互联网公司并不直接掌握数据。而背后皆有大规模算力支持 AI、区块链的运转。区块链实现数据确权和数据市场治理,数据资源的价值分享将向用户倾斜。区块链实现数据确权和数据市场治理,数据资源的价值分享将向用户倾斜。在“无主”的垄断状态下,个人用户产生的数据被广泛用来训练 AI 机器人,又产生各类互联网服务推送给用户或其他客户。大数据是基础的资源,其挖掘出的价值用户往往得不到任何回报同时还要承担隐私被侵犯和泄露的风险。未来,分布在网络中的数据将得在区块链账本中得到确权,数据的使用利用区块链 Token 授权和支付交易。互联网的价值分享将向用户倾斜。5G 边缘计算:“硬核”算力之基。边缘计算:“硬核”算力之基。3G/4G 时代,数据陆续通过接入层、承载汇聚层、承载核心层,业务数据在核心网集中处理、终结,显然这种中心化工作方式难以满足 5G 应用场景对时延、大带宽和多连接的要求。5G 时代,针对不同的业务场景,业务将在不同节点终结;以去中心化的工作方式提高效率和可靠性。分布式 AI 的崛起,5G 边缘网络平台将承载更多的算力和数据流量。催化剂:催化剂:分布式 AI 应用的快速普及。风险提示风险提示:分布式 AI 产品推广展不达预期、区块链基础研发不达预期。增持增持(维持维持)行业行业走势走势 作者作者分析师分析师 宋嘉吉宋嘉吉 执业证书编号:S0680519010002 邮箱: 相关研究相关研究 1、通信:边缘计算趁势崛起,“云”“雾”并行助力5G2019-03-04 2、通信:两会召开在即,关注工业互联网+国企改革2019-03-03 3、通信:MWC 催化+贸易摩擦预期好转,“大票搭台,小票唱戏”2019-02-24。2019 年 03 月 10 日 P.2 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 内容目录内容目录 1.科创未来的情景畅想.32.结论:算力、算法和数据5G、AI 和区块链融合之道.42.1.算法:由中心封闭到开源化、模块化.6 2.2.算力:从集中云算力走向终端分布式算力.7 2.3.数据:由“无主”的垄断走向确权治理.7 2.4.市场奖励:经济利益向用户倾斜.11 3.分布式 AI 崛起:移动端硬件构架向 GPU 倾斜.124.区块链:给大数据赋予经济动能.144.1.区块链:下一代智能互联网的基石.14 4.2.区块链将建立一个规范健康的数据市场.17 5.5G 边缘计算:“硬核”算力之基.175.1.分布式系统的崛起催生边缘计算平台和新的网络构架.17 风险提示.18 图表目录图表目录 图表 1:当前的互联网模式下巨头事实上垄断了数据、价值和网络效应,处于产业链核心.3 图表 2:区块链、AI 和 5G 的融合下,未来互联网商业模式将被颠覆.4 图表 3:区块链带来数据市场治理、加速打破互联网价值垄断.5 图表 4:区块链、AI 和 5G 融合,催生互联网商业新模式.6 图表 5:2018 年国内互联网公司重要数据泄露事件.8 图表 6:2018 年国外互联网公司重要数据泄露事件.8 图表 7:移动端分布式学习并不需要上传本地隐私数据,将成为打破数据垄断的关键一环.11 图表 8:未来时代,数据价值向用户倾斜.12 图表 9:谷歌移动端分布式联合机器学习工作流程.13 图表 10:谷歌 Android 设备键盘 Gboard 会根据联合学习算法不断更新用户的查询建议模型.14 图表 11:区块链账本运行原理.15 图表 12:传统财富是以中心化机构为核心进行流转.16 图表 13:区块链账本登记的财富流转于去中心化网络.16 图表 14:随着数字货币的发展,区块链成为新一代互联网基础协议.16 图表 15:5G 不同业务在不同点终结,边缘计算平台崛起.17 2019 年 03 月 10 日 P.3 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 1.科创未来的情景畅想科创未来的情景畅想 过去两年,区块链试图改造什么?过去两年,区块链试图改造什么?在 BTC 之后,陆续出现了 ETH、EOS 等更为开放的公链平台,以此为基础吸引开发者进行 DAPP 开发,但现实的情况是,DAPP 数量上升迅速,但活跃度却很低,有些几乎 24小时没有活跃用户。其背后的原因,首先是基础设施不完善,公链的性能无法与中心化系统相比,开发的 DAPP 本就没有 APP STORE 里的好用,二是使用门槛高,对于公钥、私钥等一些列概念,用户无法按照过往使用 APP 软件的习惯直接迁移,三是商业模式并未成型,包括大家一致在探讨的经济模型问题 BUG 不断。回归到区块链技术本身,我们看到 EOS、TRON 等公链活跃的背后,是其相对中心化的设计理念,现实应用需求与比特币本身的理想化场景正在分道扬镳,对于前者,我们将放到更大的 IT 发展浪潮中去审视,5G、AIoT 的发展本身推动边缘能力强化,将为其应用提供强大的网络、IT 支撑。当前互联网商业模式下,巨头垄断了数据、价值和网络效应,用户处于弱势地位。当前互联网商业模式下,巨头垄断了数据、价值和网络效应,用户处于弱势地位。互联网已经极大改变了人们的生活方式,互联网大数据越来越成为巨大的价值宝藏,由此造就了一批互联网巨头,包括 Amazon、Google、Facebook 和苹果公司,其中不乏市值万亿的。当下的互联网构架下,我们要依赖于互联网公司提供的服务进行购物、搜索和社交,账户管理和数据信息由互联网公司的平台来管理。互联网公司成功的秘诀是垄断了数据和网络效应互联网公司云服务器中存储大量的数据,其中很多是用户的隐私数据。虽然互联网公司声称会保护好用户的隐私,但数据泄露时有发生。还有一方面容易被忽视的就是数据的权益数据是极具价值潜力的资源,随着人工智能算法的快速进步,大数据这个宝藏的价值不断被挖掘出来但问题是,这些价值权益该属于谁呢?显然,用户并没有得到太多的好处,仅仅是因为自己的数据托管在互联网公司的服务器内,便冒着泄露的风险拿去被各种大数据工具挖掘价值,给互联网公司创造收益。互联网带来各种便利的同时人们不应该忘记自身数据处于泄露风险之中,同时数据还在“喂养”互联网公司的 AI 机器人,然而用户没有得到任何好处。图表 1:当前的互联网模式下巨头事实上垄断了数据、价值和网络效应,处于产业链核心 资料来源:国盛证券研究所 个人用户互联网公司是 大数据的产生者 数据“托管”在互联网服务器内 实际并不掌控自己数据 承担数据隐私泄露风险 大数据实际掌控者 利用AI 算法挖掘数据价值 享受大数据价值的收益 稍有不慎便会有数据泄露 垄断网络效应垄断数据、价值、网络效应各类商家 向互联网公司购买数据服务 支付渠道费用 2019 年 03 月 10 日 P.4 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 区块链、区块链、AI 和和 5G 的不断融合,互联网商业模式将更加去中心化,从算法、算力和数据的不断融合,互联网商业模式将更加去中心化,从算法、算力和数据三个层面重构数据价值、硬件和互联网构架。三个层面重构数据价值、硬件和互联网构架。移动设备和物联网智能设备遍布整个互联网,个人的行为产生海量数据,这些数据极具价值潜力。过去我们要依赖于互联网公司提供的服务进行购物、搜索和社交等服务,账户管理和数据信息由互联网公司的平台来管理毕竟分散的海量个人终端无法像云服务器那样提供管理数据的平台,这是互联网公司垄断数据的根源。区块链提供了一个大规模点对点的对等账户网络,管理数据和账户不再依赖于中心服务器,使得海量个人终端联合管理数据和账户系统成为可能。区块链的加密特征,确保了个人对数据享受所有权,互联网公司再也不能随意从个人终端设备拿走用户的隐私数据无论数据存在在哪里。5G 通信网络为海量数据传送和终端算力提供了基础支撑,互联网去中心的趋势下,离不开 5G 网络的推动。用户因数据收益、互联网公司变成算法供应商,整个产业链利益分配被重构。用户因数据收益、互联网公司变成算法供应商,整个产业链利益分配被重构。我们畅想一下,未来的用户在网络里购物、社交聊天或者打游戏,产生的数据和用和账号都通过区块链网络来确保所有权不被侵犯;提供服务的互联网公司再也不能像过去那样随意访问用户的数据、更不能用自己的 AI 机器人进行数据价值挖掘互联网公司不再掌控用户数据。互联网公司开发的 AI 算法机器人可以在用户终端进行机器学习训练,但只能得到最终的模型反馈用户的数据不会免费使用,互联网公司需要通过区块链 Token 进行支付像用户购买数据使用权(用以训练机器人)。算法模型会输出很多有价值的服务包括精准营销、信用评估服务、家庭智能机器人等等,互联网公司和用户都可以分享这些价值的收益。比如,互联网公司变成了算法模块的供应商(并不掌控用户的隐私数据),为零售商提供用户精准营销的算法模块而获利,用户通过出售个人数据的使用权(用来训练机器人,但并不会泄露出去)获得了作为数据上游的收益。图表 2:区块链、AI 和 5G 的融合下,未来互联网商业模式将被颠覆 资料来源:国盛证券研究所 2.结论:算力、算法和数据结论:算力、算法和数据5G、AI 和区块链融合之道和区块链融合之道 产生海量大数据区块链系统确保数据所有权互联网公司支付Token购买授权,使用数据训练AI 算法分布式算法在移动端联合学习云端聚合移动端的训练模型,并不需要获得本地个人数据输出算法模型,作为服务出售购买训练模型服务进行精准营销、智能机器人服务、信用评估服务等算法服务用户互联网公司各类商家数据授权产品服务 2019 年 03 月 10 日 P.5 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 随着智能手机和物联网智能终端的普及,在区块链、人工智能和随着智能手机和物联网智能终端的普及,在区块链、人工智能和 5G 的推动下,算力、的推动下,算力、算法和数据三个层面重构互联网商业模式。算法和数据三个层面重构互联网商业模式。如今,人类社会活动从未如此依赖移动设备,算力由个人 PC、服务器端向移动终端迁移,人工智能算法处理海量的数据,这些数据越来越多由用户移动端本地产生。人类数据的生产量和存储量呈指数级增长,过去 5 年里数据量已经从 TB(1024GB=1TB)级别跃升到 PB(1024TB=1PB)、EB(1024PB=1EB)乃至于 ZB(1024EB=1ZB)级别。过去 20 年互联网巨头们依靠享受大量数据的支配权(实际上用户一直强调数据是属于他们)和强大的网络效应掌控了互联网的主要资源和价值。在技术的快速发展过程中,互联网的商业经历了计算机的开源、软件的开源和数据的开源,曾经的巨头垄断被不断打破。如今,随着区块链、人工智能和 5G 等信息技术的崛起,整个互联网加速由巨头互联网公司中心走向分布式和去中心化,价值垄断正在被打破。图表 3:区块链带来数据市场治理、加速打破互联网价值垄断 资料来源:国盛证券研究所 在 5G 通信技术和人工智能算法的驱动下,互联网大数据的价值潜力不断被挖掘,大数据的世界需要一个市场规则和经济激励制度这真是区块链的价值所在。区块链完美地解决个人数据确权和授权交易,为大数据这列高速列车提供了规范的轨道。我们认为,在区块链、我们认为,在区块链、AI 和和 5G 融合的推动下,互联网将呈现新商业模式。互联网公司融合的推动下,互联网将呈现新商业模式。互联网公司对数据的控制力下降,出现算法模式供应商;区块链网络为数据隐私和数据市场治理提对数据的控制力下降,出现算法模式供应商;区块链网络为数据隐私和数据市场治理提供基础协议,用户分享更多数据价值;供基础协议,用户分享更多数据价值;5G 边缘网络的算力平台将承载更多终端流量,边缘网络的算力平台将承载更多终端流量,改变先有网络构架;移动终端的硬件构架向改变先有网络构架;移动终端的硬件构架向 GPU 倾斜。倾斜。个人个人PCPC应用软件应用软件互联网时代互联网时代智能手机和智能手机和移动互联网移动互联网区块链、区块链、AIAI、大数据融合大数据融合硬件时代软件时代数据和网络效应时代移动互联网时代19601970198019902000201020202030硬件垄断到开源硬件垄断到开源软件垄断到开源软件垄断到开源数据、算法垄断数据、算法垄断移动移动端网络和数据垄断端网络和数据垄断区块链治理下的数据市场时代!2019 年 03 月 10 日 P.6 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 图表 4:区块链、AI 和 5G 融合,催生互联网商业新模式 资料来源:国盛证券研究所 2.1.算法算法:由中心封闭到开源化、模块化:由中心封闭到开源化、模块化 移动端分布式人工智能机器人将是未来主流。移动端分布式人工智能机器人将是未来主流。人工智能的要素包括算力、算法和数据。它的发展需要算力的支撑,而数据是“喂养”人工智能机器学习的资料。作为基础资源的数据越来越多由移动端产生,伴随着数据隐私保护的呼声愈烈,掌握算法工具的互联网公司在挖掘“数据金矿”的时候只会越来越受到限制。产品级分布式机器学习的推广已经指日可待,互联网巨头们并不必要将移动终端的用户隐私数据上传至云中心,而终端只需输出学习模型结果。区块链网络实现了数据市场治理,可以有效打破过去个人数据的“无主”垄断状态。区块链网络实现了数据市场治理,可以有效打破过去个人数据的“无主”垄断状态。个人的隐私数据实际上是被互联网公司掌控,泄漏的风险的危险下,个人数据资源被互联网公司的算法工具进行分析处理,而用户并不能分享数据产生的价值当某家互联网公司根据你的行为数据给你推荐商品广告时,你有没有想过这个服务价值来自于本属于你的个人数据?区块链很好地解决了数据的隐私问题数据的确权是属于用户的,其他人或公司若想使用这些数据或利用这些数据作为资料训练 AI 机器人的话,都将在区块链网络中申请得到用户本人的授权,在区块链账本中完成交易支付。5G 边缘网络和雾计算作为网络通信基础,催生新的商业模式。边缘网络和雾计算作为网络通信基础,催生新的商业模式。不久全球将进入 5G 网络的时代,广泛分布的移动端、云中心之间的数据交换方式产生着深刻的变革更多的数据交换将在终端之间发生。5G 的边缘网络和雾计算将为数据下次提供网络通信的基础,同时边缘网络的构架和数据通信模型催生新的产品和商业模式。未来算法可以预想呈现模块化、产品化的趋势,互联网公司由数据和网络效应的垄断者未来算法可以预想呈现模块化、产品化的趋势,互联网公司由数据和网络效应的垄断者逐渐蜕变为算法模块的产品商。逐渐蜕变为算法模块的产品商。未来,互联网巨头不必掌握用户的行为数据,只提供算法工具,通过区块链网络得到授权、完成数据使用权的费用支付,训练 AI 机器人。届时,互联网公司也许不再是数据和网络效应的垄断者,蜕变为算法产品化模块的供应商别忘了,区块链网络重塑了数据市场的治理,互联网公司并不直接掌握数据。2019 年 03 月 10 日 P.7 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 2.2.算力算力:从集中云算力走向终端分布式算力:从集中云算力走向终端分布式算力 移动端和物联网智能设备的移动端和物联网智能设备的迅猛发展迅猛发展,势必需要算力从集中向终端分布式部署,势必需要算力从集中向终端分布式部署,最终在,最终在中心化和分布式两者间取得平衡中心化和分布式两者间取得平衡。人工智能在算法优化阶段需要投入大量的算力,Google 的明星机器人 AlphaGo 在击败李世石之前,DeepMind 团队使用了 48 颗 TPU 对AlphaGo 进行了数个月的 3000 多万盘对弈训练。显然移动时代,大量的数据在本地存储的模式不在适合。因此,算力一定会随着移动设备和物联网智能设备的发展而向边缘倾斜,实现算力的分布式部署。服务端与客户端分离的结构,移动端的分布式机器学习就成为重要的方向,Google 在这方面已经获得产品级突破Google 基于 TensorFlow构建了全球首个产品级可扩展的大规模移动端联合学习系统,目前已在数千万台手机上运行。分布式算力的瓶颈还在于有效的经济激励机制的施行有效的经济激励机制的施行,而区块链的激励机制正好提供很好的市场激励制度。2.3.数据数据:由“无主”的垄断走向确权治理:由“无主”的垄断走向确权治理 互联网数据处于“无主”垄断的混乱状态,数据隐私将是未来的最“痛点”。互联网数据处于“无主”垄断的混乱状态,数据隐私将是未来的最“痛点”。据 BM Security和 Ponemon Institute 此前发布的2018 数据泄露损失研究评估显示,2018 年全球数据泄露的平均成本为 386 万美元,比 2017 年的报告高出 6.4%。该研究还首次计算了与“超大型泄露(超过 100 万条记录)行为相关”的成本。评估显示,大型数据泄露代价高昂,百万条记录可致损失 4000 万美元,5000 万条记录可致损失 3.5 亿美元。互联网带来各种便利的同时人们不应该忘记自身数据处于泄露风险之中,同时数据还在“喂养”互联网公司的 AI 机器人。2019 年 03 月 10 日 P.8 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 图表 5:2018 年国内互联网公司重要数据泄露事件 涉及公司涉及公司 数据泄露事件数据泄露事件 多个外卖平台 4 月 23 日,新京报曝光了美团、饿了么等外卖平台用户信息被泄露,卖家、网络运营公司以及外卖骑手参与其中,每条信息最低不到一毛钱,却精确到你吃的什么、在哪儿吃的等私密信息。AcFun 6 月 13 日,AcFun 弹幕视频网(简称“A 站”)发公告称,平台有 800-1000 万左右的用户数据被黑客窃取。随后,暗网上出现了 A 站用户信息的售卖,并喊出900 万条用户数据,售价 40 万人民币。而早在今年 3 月份,暗网论坛中就有人公开出售 AcFun 的一手用户数据,数量高达 800 万条,而价格仅为 12000 元,平均 1 元能买到 800 条。前程无忧前程无忧 6 月 16 日,暗网上出现叫卖招聘网站前程无忧的用户信息,其中涉及 195 万用户的求职简历,随后前程无忧方面确认部分用户账户密码被撞库,并强调,出现这样的情况并非拖库,而是恶意用户通过这些已泄露的邮箱账户及密码,对相应的站点进行登录匹配,然后蓄意倒卖。圆通 6 月 19 日,一位 ID 为“f666666”的用户公然在暗网上兜售圆通 10 亿条快递数据。按照卖家的说法,这些数据是 2014 年下旬的数据,数据信息包括寄(收)件人姓名,电话,地址等信息,都是圆通内部人士批量出售而来(只要快递单信息进入电脑他们就可以获取)。顺丰 2018 年 8 月底,一个 ID 为“bijiaodiao1688”的用户公然在暗网上售卖顺丰快递数据,其中牵扯到了 3 亿用户数据信息,售价是 2 个比特币,而这些信息中包含了寄件人、收件人的姓名、地址、电话等,而购买者可以选择先“验货”,验货数据量 10 万条,验货费用 0.01 个比特币。华住集团旗下多个连锁酒店 8 月 28 日,网曝疑似华住集团旗下连锁酒店用户数据在暗网售卖。从卖家发布内容看,数据包含华住旗下汉庭、美爵、禧玥、漫心、诺富特、美居、CitiGo、桔子、全季、星程、宜必思、怡莱、海友等酒店。泄露的信息包括华住官网注册资料、酒店入住登记的身份信息及酒店开房记录,住客姓名、手机号、邮箱、身份证号、登录账号密码等。卖家对这个约 5 亿条数据打包出售价格为 8 比特币或 520 门罗币。陌陌 12 月 3 日,网传陌陌 3000 万数据在暗网被售卖,以 50 美元的价格出售。根据网上流传的截图中,卖家以“陌陌 3000 万数据库”为名称,包含手机号、密码等字段,数据写入时间是 2015 年 7 月 17 日。卖家称数据通过撞库得来。你我贷 12 月 20 日,有媒体曝光 P2P 平台你我贷的 65000 条贷款数据在暗网被明码标价售卖。卖方称数据是从线下渠道流出,截止到今年 10 月中旬以前,内容包括用户真实姓名,手机号和所在地区。5000 条数据售价 60 美元,全套需要拍 10份。资料来源:艾媒网、国盛证券研究所 图表 6:2018 年国外互联网公司重要数据泄露事件 涉及公司涉及公司 数据泄露事件数据泄露事件 Aadhaar 1月3日网友发现能够通过一个WhatsApp匿名群组花上500卢比就能获得访问该数据库的一个账号。通过输入任何一个 Aadhaar 号码(一个 12 位的唯一标识符,每个印度公民会使用到它)检索印度唯一身份识别管理局(UIDAI)存储的关于被查询公民的诸多类型的信息。这些数据包括姓名、住址、照片、电话号码和电子邮箱地址。在向卖家额外支付 300 卢比的费用后,任何人都可以通过该软件打印某个 Aadhaar 号码归属者的身份证。这起数据泄露事件已经损害了在印度注册的 11 亿公民的个人信息。Facebook 2018 年 3 月 17 日,美国纽约时报率先曝光了剑桥分析(Cambridge Analytica)未经用户许可,擅自使用 Facebook 用户个人信息的行为。随后英国高等法院授权对涉事单机构进行了搜查,并揭开了针对该事件司法调查的序幕。随后,Facebook 公开回应,承认剑桥分析公司不正当使用了 8700 2019 年 03 月 10 日 P.9 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 万未经授权的用户私人信息。今年 9 月,Facebook 再次通告,黑客利用控制的 40 万个账户获得了 3000 万 Facebook 用户账号的信息。他们可以在不输入密码的情况下,随意登陆这些用户的个人主页,任意拿走想要的数据等。Under Armour 3 月 30 日,美国运动品牌 Under Armour 对外表示,旗下健身应用MyFitnessPal 因存在数据漏洞而遭到黑客攻击,一共有 1.5 亿用户的数据被泄露,这些数据中包含了用户名、电子邮件地址和密码等,不过官方强调,泄密数据并不包含驾驶证号、信用卡号、身份信息等更私密信息。Panera Bread 4 月 4 日,美 国 最 大 面 包 连 锁 店 Panerabread 表 示,旗 下 网 站泄 露 了3700万 用 户 信 息。随 后,安 全 机 构KrebsOnSecurity 表示,他们在早在 2017 年 8 月 2 日就曾发现了Panerabread 网站的漏洞,告知对方后并没有进行及时修复,所以造成的结果就是严重的。尽管该公司最初试图淡化此次数据泄露事件的严重程度,并表示受到影响的客户不到 1 万人。Saks 和 Lord&Taylor 3 月底,安全公司 Gemini Advisory 偶然发现了一个来自 JokerStash 黑客集团发布的公告,宣称已出售有关 500 万张被盗信用卡和借记卡的数据。经调查,数据泄露归因于 Saks Fifth Avenue 和 Lord&Taylor 的系统入侵。Ticketfly 5 月 31 日,美国票务巨头 Ticketfly 遭遇黑客攻击勒索,导致音乐会和体育赛事票务网站遭到破坏,并离线和中断一周。此次攻击事件背后的黑客先是警告 Ticketfly 存在一个漏洞,并要求其支付赎金。当遭到该公司的拒绝后,黑客劫持了 Ticketfly 网站,替换了它的主页。黑客 IsHaKdZ 表示,他手中拥有完整的数据库,里面包含 2700 万个 Ticketfly 账户相关信息(如姓名、家庭住址、电子邮箱地址和电话号码等,涉及员工和用户)。MyHeritage 今年 6 月初,MyHeritage 给出公告称,网站服务器被攻击,攻击者从中截取了超过 9200 万用户信息,其中包含了电子邮件和 hash 密码,官方则强调不包含支付卡的信息或 DNA 测试结果。不过 MyHeritag 还表示,用户帐户是安全的,因为密码是使用每个用户唯一的加密密钥进行 hash 处理的,为了彻底解决这种攻击,最终网站启用了双因子身份验证(2FA)功能,即使黑客设法解密 hash 密码,如果没有第二步验证码,第一步的破解也将毫无用处。Exactis 安全研究员 Vinny Troia 在 2018 年 6 月发现,总部位于佛罗里达州的市场营销和数据聚合公司 Exactis 已将一个数据库暴露在可公开访问的服务器上。该数据库包含 2TB 的信息,其中包括数亿美国人和企业的详细信息。在撰写本文时,Exactis 尚未确认受此事件影响的确切人数,但 Troia 表示他能够找到近 3.4 亿条个人记录。他还向 Wired 证实,此事件暴露了消费者的电子邮箱地址、实际地址、电话号码以及一系列的其他个人信息,在某些情况下包括极其敏感的细节,如孩子的姓名和性别。Sacramento Bee 今年 2 月,一名匿名攻击者截获了由 Sacramento Bee 拥有并运营的两个数据库。其中一个 IT 资产包含加利福尼亚州州务卿提供的加州选民登记数据,而另一个则存储了用户为订阅该报刊而提供的联系信息。在截获了这些资源之后,攻击者要求支付赎金以换取重新获得对数据的访问权限。Sacramento Bee 最终拒绝了这一要求,并删除了数据库,以防止在将来这些数据库在被利用来进行其他更多的攻击。万豪喜达屋万豪喜达屋 11 月 30 日,万豪对外发出公告称,旗下喜达屋酒店预订系统 2014 年起遭网络“黑客”入侵,泄露大约 5 亿客户的用户信息,包括用户的姓名、住址、电话号码、电子邮件地址、护照号码、信用卡等所有核心的信息。随后,美国 5 个州的总检察长和英国信息专员对外表示,将彻底调查这件事,并让万豪付出相应的惩罚。有美国诉讼集团代表众多消费者向万豪提起诉讼,索赔金额高达 125 亿美元(仅相当于 5 亿潜在被盗用户中每人得到 25 美元的赔偿)。Google+12 月 11 日,在发现因软件漏洞导致 5200 万用户数据泄露后,谷歌表示将提前 4 个月关闭旗下社交网络 Google+的消费者版本。该漏洞影响了 5250 2019 年 03 月 10 日 P.10 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 万用户的信息,这些信息不仅包括 Google+个人用户的姓名、电子邮件地址、性别和年龄,还包括一些企业用户的账号。资料来源:艾媒网、国盛证券研究所 数据隐私的真谛是确权和使用权的交付,区块链的机制提供了数据市场的治理规则数据隐私的真谛是确权和使用权的交付,区块链的机制提供了数据市场的治理规则。移动时代数据隐私的保护呼声愈烈,一方面是人们对数据作为一种潜力巨大的价值资源的认识越来越清晰,另一方面大量数据天然跟移动端的行为关联,用户越来越注意数据隐私的保护。过去的互联网模式,数据主要存储在互联网公司的云端,用户很难声明对数据的所有权;另外,互联网不断产生的庞杂数据的确权也是出于模糊的“无主”状态,但所有数据实际上都是掌控在互联网公司手中无论他们如何声明不会泄露数据,不泄露数据不代表我们享有所有权。越来越多的智能服务背后都是来自于互联网公司 AI机器人利用个人隐私数据进行机器学习的结果,这个过程中,用户是被动的,利益上存在受损的嫌疑。我们认为,数据隐私的真谛是确权和授权我们认为,数据隐私的真谛是确权和授权即即用代码用代码合约合约明确数据的所有权,通过代明确数据的所有权,通过代码码合约合约完成数据使用权的授权和支付交易完成数据使用权的授权和支付交易。区块链天然就是去中心化和分布式的账本机制,具有数据加密、不可篡改、来源可溯的特点。大量移动端的数据,将由过去“无主”垄断状态,被区块链网络确权给用户,而 AI 所需要的个人数据,可以由用户向使用方授权完成,相关费用用 Token 完成支付。在数据领域,AI 与区块链的结合,一方面是数据层,两者可以互相渗透,完全数据确权;另一方面是从应用层面入手,两者各司其职,AI 负责自动化的业务处理和智能化的决策,区块链负责在数据层提供可信的授权。移动端分布式学习移动端分布式学习技术的推广技术的推广将成为打破数据垄断的关键一环。将成为打破数据垄断的关键一环。今年 2 月谷歌宣布实现了全球首个产品级的超大规模移动端分布式机器学习系统,目前已经能够在数千万部手机上运行。此产品利用联合学习(FL,Federated Learning)方法,可以对保存在移动电话等设备上的大量分散数据进行训练,是“将代码引入数据,而不是将数据引入代码”的更加通用化的一个实现。用户的设备会下载一个当前模型,这个模型会从手机数据中学习不断得到改善,然后将变化总结为一个小的关键更新。只有这个关键更新会以加密的方式被传到云端,之后这一更新会在云端迅速被其他用户对共享模型提交的更新平均化(averaged)。简单说,所有的训练数据都留在用户的设备上,而且上传到云端的个别更新也不会存储到云端。新方法将机器学习与云端存储数据的需求脱钩,让模型更聪明、延迟更低、更节能,而且保护用户隐私不受威胁。联合学习方法将使得移动终端数据的隐私得到充分的保护,互联网公司云端服务器并不需要上传用户本地数据,将成为打破数据垄断的关键一环。2019 年 03 月 10 日 P.11 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 图表 7:移动端分布式学习并不需要上传本地隐私数据,将成为打破数据垄断的关键一环 资料来源:国盛证券研究所 2.4.市场市场激励激励:经济利益向用户倾斜:经济利益向用户倾斜 数据资源的价值分享,将向用户倾斜。数据资源的价值分享,将向用户倾斜。在“无主”的垄断状态下,个人用户产生的数据被广泛用来训练 AI 机器人,又产生各类互联网服务推送给用户或其他客户。大数据是基础的资源,其挖掘出的价值用户往往得不到任何回报同时还要承担隐私被侵犯和泄露的风险。未来,分布在网络中的数据将得在区块链账本中得到确权,数据的使用利用区块链 Token 授权和支付交易。互联网的价值分享将向用户倾斜。移动端本地数据用于训练移动端AI 机器人,并不会上传至云端移动端AI 算法利用本地数据不断更新个性化模型,然后聚合其他移动端更新形成新的共享模型,加密的共享模型上传至云端 2019 年 03 月 10 日 P.12 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 图表 8:未来时代,数据价值向用户倾斜 资料来源:国盛证券研究所 接踵而来的问题是,如何构建合理的激励体系?接踵而来的问题是,如何构建合理的激励体系?区块链在 TOKEN 激励机制上的讨论一直不绝于耳,最初的 BTC 构建了通缩模型,即总量一定,产量四年减半一次,用算力保证系统的运转及激励分配的公平性。此后很多与现实相关联的激励体系却遇到了很大的问题,比如迅雷的玩客币体系,抛开监管问题,但从系统本身的可持续性也有待商榷。用过迅雷下载的朋友都知道,当电脑运行迅雷终端的时候,PC 即成为网络中的存储节点,这个点对点系统非常契合区块链的去中心化理念,但用户在这其中贡献了硬件及带宽,为了鼓励在线,迅雷也有过积分奖励,而其本质增加推广费用去“获客”,直到玩客币的推出。假设为系统做出贡献可以获得玩客币(俗称“挖矿”),而玩客币既可以从生态中购买服务,也可以二级市场交易,用户自然有动力投入硬件和费用去挖矿,生态体系建设加速,且公司不需要投入费用,而当币价走高时,由于回本周期缩短,用户有更强的欲望加大投入,当然,其更倾向于将玩客币用于二级市场交易而非获得生态中的服务,相反,当币价下跌时,激励机制就会出现问题,毕竟生态中所能提供的服务不能实时地与币价相匹配。目前,互联网巨头作为主体获得并使用大数据,不存在激励问题,而未来在 5G 时代,面向个人数据、版权的确权和使用,同样需要构建有效交易市场,激励体系的构建仍是关键。3.分布式分布式 AI 崛起:移动端硬崛起:移动端硬件构架向件构架向 GPU 倾斜倾斜 谷歌发布全球首个产品级移动端分布式机器学习系统谷歌发布全球首个产品级移动端分布式机器学习系统,移动端算力被充分调动,移动端算力被充分调动。今年 2月谷歌宣布实现了全球首个产品级的超大规模移动端分布式机器学习系统,目前已经能够在数千万部手机上运行。谷歌基于 TensorFlow 构建了全球首个产品级可扩展的大规模移动端联合学习系统,目前已在数千万台手机上运行。这些手机能协同学习一个共享模型,所有的训练数据都留在设备端,确保了个人数据安全,手机端智能应用也能更快更低能耗更新。研究人员表示,该系统有望在几十亿部手机上运行。联合学习能产生更智能的模型,更低的延时和更少的功耗,同时确保用户的隐私。Google 开放的联合学习算法,使得移动端分布式机器学习成为现实;开放的联合学习算法,使得移动端分布式机器学习成为现实;AI 算法分布在大算法分布在大数据通过区块链账本确权和完成支付交易,确保隐私互联网公司向用户支付数据使用费用,价值向用户倾斜互联网公司掌控和挖掘数据价值用户面临隐私侵犯和泄露风险数据价值区块链、AI和5G融合下的数据市场治理时代数据“无主”垄断时代 2019 年 03 月 10 日 P.13 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 规模的移动端,协同输出一个学习模型,而不必上次用户本地数据。规模的移动端,协同输出一个学习模型,而不必上次用户本地数据。Google 的研究团队克服许多算法和研究挑战,使联邦学习成为可能。诸如随机梯度下降(SGD)之类的优化算法(通常在许多机器学习系统中使用)在大型数据集上运行。在移动端特定环境中,数据以高度异构的方式分布在数百万个移动和蜂窝设备上,这些设备具有明显更高延迟,更低吞吐量的连接,并且只能间歇性地用于训练。这一切都依赖于联合学习(FL)方法,联合学习是一种分布式机器学习方法,可以对保存在移动电话等设备上的大量分散数据进行训练,是“将代码引入数据,而不是将数据引入代码”的更加通用化的一个实现,并解决了关于隐私、所有权和数据位臵等基本问题。根据谷歌官博介绍,用户的设备会下载一个当前模型,这个模型会从手机数据中学习不断得到改善,然后将变化总结为一个小的关键更新。只有这个关键更新会以加密的