分享
【海通国际证券】ChatGPT:细探商业模式与供给端决定因素 2.pdf
下载文档

ID:3038462

大小:7.82MB

页数:53页

格式:PDF

时间:2024-01-18

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
海通国际证券 【海通国际证券】ChatGPT:细探商业模式与供给端决定因素 通国 证券 ChatGPT 商业模式 供给 决定 因素
Table_yemei1 观点聚焦 Investment Focus Table_yejiao1 本研究报告由海通国际分销,海通国际是由海通国际研究有限公司,海通证券印度私人有限公司,海通国际株式会社和海通国际证券集团其他各成员单位的证券研究团队所组成的全球品牌,海通国际证券集团各成员分别在其许可的司法管辖区内从事证券活动。关于海通国际的分析师证明,重要披露声明和免责声明,请参阅附录。(Please see appendix for English translation of the disclaimer)研究报告 Research Report 28 Feb 2023 中国互联网中国互联网 China Internet ChatGPT:细探商业模式与供给端决定因素 ChatGPT:Examining the Business Model and Determining Factors on Supply Side Table_Info 股票名称 评级 股票名称 评级 腾讯控股 Outperform 华住 Outperform 阿里巴巴 Outperform 心动公司 Outperform 拼多多 Outperform 虎牙 Neutral 美团 Outperform 知乎 Outperform 京东 Outperform 雅乐科技 Neutral 网易公司 Outperform 祖龙娱乐 Neutral 百度 Outperform IGG Neutral Sea Outperform 斗鱼 Neutral 携程集团 Outperform 同程旅行 Neutral Boss 直聘 Outperform 快手-W Outperform 哔哩哔哩 Outperform 商汤-W Outperform 唯品会 Outperform 爱奇艺 Neutral 微博 Outperform 阅文集团 Neutral 欢聚时代 Outperform 资料来源:Factset,HTI Related Reports TEMU 物流研究及美国尾程配送现状一览(How TEMU fulfill its orders and a glance of US last mile delivery)(16 Dec 2022)阿里巴巴 2022 云栖大会亮点小结(Takeaway from Alibaba 2022 APSARA Conference)(7 Nov 2022)广深跨境电商调研小结(Takeaway from E-commerce Field Trips in Guangzhou and Shenzhen)(31 Oct 2022)本篇报告我们回顾梳理了海内外巨头在 ChatGPT 上的布局,并分析了未来供给端的决定因素。ChatGPT 作为爆款应用出圈,背后有技术和管理上的必然性:作为爆款应用出圈,背后有技术和管理上的必然性:ChatGPT 在上线 5 日内突破 100 万注册用户,两个月内突破 1 亿用户,成为全球最快用户破亿的互联网软件。技术上,ChatGPT 基于Transformer 架构,历经多轮训练迭代,叠加算力上微软的大力支持,参数量从最初 1.17 亿进化到了 1750 亿,这带来了技术上的先发优势和杀手级的用户体验。管理上,OpenAI 作为非盈利机构,没有上市和业绩压力,因此拥有更多试错空间和更从容的研发氛围。因此,我们认为ChatGPT可维持其现有优势,将会是AI时代的赢家之一。而且,参考 ChatGPT 演变过程,我们认为前期的巨额投我们认为前期的巨额投入和从容的研发氛围,也是成为国内该领域最后赢家的必要条入和从容的研发氛围,也是成为国内该领域最后赢家的必要条件。由此,国内目前各大厂的现状,仍存在改良空间。件。由此,国内目前各大厂的现状,仍存在改良空间。商业模式处于探索阶段,落地场景上广告或率先起量,长期会以商业模式处于探索阶段,落地场景上广告或率先起量,长期会以用户付费为主导、促成再一次工业革命类的生产力提升:用户付费为主导、促成再一次工业革命类的生产力提升:目前ChatGPT 的商业化探索仍在早期阶段,具体措施包括在 C 端推出订阅服务,在 B 端整合进入微软云服务生态圈等。长期来看,训练与硬件成本的下降将为生成式 AI 技术在 B、C 端大规模应用提供基础和支撑,应用场景可包括线上客服、教育、电商、软件开发、传媒、艺术、游戏等。但短期而言,较为明确的路径为革新搜索市场,争夺广告份额:微软 Bing 的先例可做管中窥豹。不过另一方面,随着微软搜索广告在低基数下的高速增长,谷歌股价或暂时承压;同理或可解释百度在同理或可解释百度在 OpenAI 上的急迫感。上的急迫感。国内应用端玩家虽面临算力掣肘,但短期竞争的决定因素或在于国内应用端玩家虽面临算力掣肘,但短期竞争的决定因素或在于应用场景和转型决心:应用场景和转型决心:参考海外产业链,目前中国产业链在基础设施层,主要是高性能芯片方面和海外存在巨大差距。但在芯片被卡脖子的现实下,也预示着国产替代玩家的发展空间(如寒武纪、璧仞科技等),他们可能首先在财务上享受到 AI 浪潮红利。而对于应用端的互联网大厂而言,高性能GPU芯片卡脖子是他们面临的共同问题,但由于技术敏感性,国内市场此后应为国内玩家主导,所以国内玩家主要还是内部竞争;且目前而言,各家 A100 囤货已能满足现阶段需求,且 A800 即将出货,以及训练效率快速提升,卡脖子问题或到2025年方会呈现。从目前技术储备上看,ChatGPT的出现已经指明了技术迭代的方向,各家纠偏只是时间问题。因此,我们认为国内竞争的关键点在于落地场景:巨头需考虑这些落地场景是侵蚀主营业务的地盘,还是带来增量为主,并在这个基础上考量自身的转型决心。此外,研发氛围、新业务投入周期、及人才管理等软实力亦尤为重要-而我们认为,腾讯和字节在这些方面具有而我们认为,腾讯和字节在这些方面具有优势、但团队并不紧迫;百度硬性优势明显,急迫感突出,但执优势、但团队并不紧迫;百度硬性优势明显,急迫感突出,但执行力存疑。后续需紧密关注各家团队流失率指标。行力存疑。后续需紧密关注各家团队流失率指标。Table_Author Natalie Wu,CFA Barney Yao Yulin Zhong,CFA Jasmine Bai 557085100115Feb-22May-22Aug-22Nov-22Feb-23HAI China InternetMSCI C扫码进群领取3、最新业报告、公司研究、专业咖分享1、优质研报免费获取,业报告定期打包2、每推送业最新深度研报(精选10篇) 28 Feb 2023 2 Table_header1 中国互联网中国互联网 目录:目录:1.ChatGPT:以:以GPT-3.5架构革新架构革新AI对话模型,商业化前景仍需探索对话模型,商业化前景仍需探索 _ 3 1.1 历经多轮迭代,参数量指数性上升,商业模式已见雏形历经多轮迭代,参数量指数性上升,商业模式已见雏形 _ 3 1.2 得益于技术提升,得益于技术提升,应用层面正突飞猛进应用层面正突飞猛进 _ 5 2.细探细探ChatGPT出圈原因:爆款应用背后,长期技术拐点已现出圈原因:爆款应用背后,长期技术拐点已现 _ 8 2.1 技术上,多轮迭代训练后已具备先发优势技术上,多轮迭代训练后已具备先发优势 _ 9 2.2 管理上,管理上,OpenAI 管理结构更为灵活,为大胆创新奠定了基础管理结构更为灵活,为大胆创新奠定了基础 _ 10 2.3 科技巨头躬身入局,发布重视信号科技巨头躬身入局,发布重视信号 _ 11 2.4 生成性生成性 AI 技术逐渐成熟,头部公司展开算力、算法与数据布局技术逐渐成熟,头部公司展开算力、算法与数据布局 _ 12 3.微软作为破坏性创新者,在算力微软作为破坏性创新者,在算力+算法算法+应用生态上已呈现完整布局应用生态上已呈现完整布局_ 14 3.1 强大的算力为微软在强大的算力为微软在 AI 领域奠定了良好基础领域奠定了良好基础 _ 14 3.2 AIGC 算法层面,微软在自研与合作上同时进行:算法层面,微软在自研与合作上同时进行:_ 15 3.3 应用上,商业化落地已见雏形;搜索市场份额有望提升应用上,商业化落地已见雏形;搜索市场份额有望提升 _ 17 4.Google等玩家作为防守者,短期面临更大的竞争压力等玩家作为防守者,短期面临更大的竞争压力 _ 19 4.1 防守策略之一:直面竞争防守策略之一:直面竞争 _ 20 4.2 防守策略之二:展开合作防守策略之二:展开合作 _ 23 5.国内发展如何?基础设施服务商应率先获得红利;未来应用端价值国内发展如何?基础设施服务商应率先获得红利;未来应用端价值有望被进一步挖掘有望被进一步挖掘 _ 23 6.国内应用端玩家现状一览:百度、阿里、腾讯积累深厚;其他玩家国内应用端玩家现状一览:百度、阿里、腾讯积累深厚;其他玩家亦在积极入局亦在积极入局 _ 28 6.1 百度:国内百度:国内 AI 先行者,类先行者,类 ChatGPT 产品产品“文心一言文心一言”将于将于 3 月上线月上线 _ 29 6.2 阿里巴巴:领先的云计算将为其提供云算力保障,类阿里巴巴:领先的云计算将为其提供云算力保障,类 ChatGPT 产品处于产品处于内测中内测中 _ 30 6.3 腾讯:跨模态腾讯:跨模态 AI 模型领先玩家,公司正在进行类模型领先玩家,公司正在进行类 ChatGPT 产品专项研究产品专项研究 _ 31 6.4 京东、华为、字节、网易、快手亦有布局京东、华为、字节、网易、快手亦有布局 _ 32 7.未未来展望:供给端的决定因素在于模型、数据、算力和软实力来展望:供给端的决定因素在于模型、数据、算力和软实力 _ 34 7.1 算力:训练和部署成本仍然昂贵,降本仍是商业化的首要难题算力:训练和部署成本仍然昂贵,降本仍是商业化的首要难题 _ 35 7.2 大厂的切入路径:竞争关键因素为技术、应用场景和团队管理大厂的切入路径:竞争关键因素为技术、应用场景和团队管理 _ 37 28 Feb 2023 3 Table_header1 中国互联网中国互联网 1.ChatGPT:以:以 GPT-3.5 架构革新架构革新 AI 对话模型,商业化前景仍需探索对话模型,商业化前景仍需探索 ChatGPT 是美国 OpenAI 公司研发的对话 AI 模型,是由人工智能技术支持的自然语言处理(NLP,Natural Language Processing)工具,于 2022 年 11 月 30 日正式发布。它能够学习、理解人类语言,并结合对话上下文,与人类聊天互动,也可撰写稿件、翻译文字、编程、编写视频脚本等。与现存的其他同类产品相比,ChatGPT 的独特优势在于:的独特优势在于:1)基于 GPT-3.5 架构,运用海量语料库训练模型,包括真实生活中的对话,使 ChatGPT 能做到接近与人类聊天;2)应用新技术 RLHF(Reinforcement Learning with Human Feedback,基于人类反馈的强化学习),从而能更准确地理解并遵循人类的思维、价值观与需求;3)可在同一阶段内完成模型训练;4)具有强大算力、自我学习能力和适应性,且预训练通用性较高;5)可进行连续多轮对话,提升用户体验;6)更具独立批判性思维,能质疑用户问题的合理性,也能承认自身知识的局限性,听取用户意见并改进答案。OpenAI 鼓励用户多与鼓励用户多与 ChatGPT 对话,以扩充语料库、训练模型优化对话,以扩充语料库、训练模型优化 Source:OpenAI Website;HTI 1.1 历经多轮迭代,参数量指数性上升,商业模式已见雏形历经多轮迭代,参数量指数性上升,商业模式已见雏形 2015 年,特斯拉 CEO 埃隆 马斯克、Y Combinator(美国著名创业孵化器)总裁 Sam Altman、PayPal 联合创始人 Peter Thiel 等投资 10 亿美元,在旧金山创立了非营利性组织 OpenAI,致力于开发 AI 技术。2017 年谷歌大脑推出生成式预训练模型Transformer,经大量数据集训练后成为当时最高水平的 LLM(大型语言模型)。Transformer 模型内部创造性地采用了自注意力结构(Self-Attention),相比 NLP 中的两大主流结构 RNN(Recurrent Neural Network,循环神经网络)、CNN(Convolutional Neural Network,卷积神经网络),每层具有更佳的计算复杂度,能更好地学习语法、语义等,提高训练和计算效率;由于未采用循环结构,Transformer 处理长序列时也能避免梯度消失或爆炸。具体而言:1)相比不能并行计算的 RNN,Transformer 允许并行处理输入序列中的所有位置,可直接计算点乘结果;2)相比 CNN,Transformer 可使任意两个单词间距离为 1,计算两个位置间关联的操作次数不因距离而增多,从而解决了 NLP 中长时依赖的难点问题。 28 Feb 2023 4 Table_header1 中国互联网中国互联网 Transformer 模型架模型架构构 信息来源:Google 论文Attention is All You Need,HTI 2018 年 OpenAI 公司基于 Transformer 结构推出 GPT-1(Generative Pre-training Transformers,创造型预训练变换模型),参数量为 1.17 亿个,GPT-1 超越 Transformer成为业内第一。2019 年至 2020 年,OpenAI 陆续发布 GPT-2、GPT-3,其参数量分别达到 15 亿、1750 亿,其中,GPT-3 训练过程中直接以人类自然语言作为指令,显著提升了 LLM 在多种语言场景中的性能。2019 年,OpenAI 转型为封顶盈利机构,成立 OpenAi LP 公司,同年 7 月获得微软的 10亿美元投资,9 月授予微软 GPT-3 模型的独家使用权(不影响付费用户使用)。2020年 6 月,公司发布第一款商业化产品 OpenAI API。2022 年 1 月,OpenAI 在 GPT-3 基础上进行微调,并在训练中加入人类反馈数据,推出 InstructGPT。2022 年 11 月 30 日,OpenAI 推出人工智能对话聊天机器人 ChatGPT(InstructGPT 的兄弟模型),其训练数据集为开源数据集,且参数量达到 GPT-3 的 10 倍以上,辅以人工标注数据与强化学习的运用,实现了突破性进展ChatGPT 能够围绕大量话题进行对话,拥有更接近人类的逻辑思维,可借助对话反馈强化学习,且能模仿人类的情绪。例如:1)ChatGPT 不仅通晓古今历史,能识别出问题中的事实性错误,还拥有想象力和价值判断能力,能够想象古人在现代的生活并从现代价值观视角进行评判,且语言不乏文学性;2)当用户重复同一提问时,ChatGPT 会分析提问者的反馈,推测其想法、态度,据此调整回答,并结合普世价值观,给出合理且迎合提问者心理的答案。同年 12 月 5 日,注册用户数超过 100 万;截至截至 2023 年年 1 月底,月底,ChatGPT 月活用月活用户已高达户已高达 1 亿,成为史上活跃用户规模增长最快的应用。亿,成为史上活跃用户规模增长最快的应用。 28 Feb 2023 5 Table_header1 中国互联网中国互联网 2023 年 2 月 2 日,OpenAI 推出 ChatGPT 的付费订阅版 ChatGPT Plus,提供比免费版更为快速的服务以及新功能优先试用权,月费为 20 美元。同日微软宣布旗下的全线产品将与 ChatGPT 整合,包括云计算平台 Azure 以及此前已宣布的搜索引擎 Bing(必应)、Office 等。2023 年 2 月 7 日,微软推出由 ChatGPT 支持的最新版 AI 搜索引擎Bing 和 Edge 浏览器,次日凌晨宣布已将 GPT-4 整合到 Bing 和 Edge 浏览器中。1.2 得益于技术提升,得益于技术提升,应用层面正突飞猛进应用层面正突飞猛进 ChatGPT 的问世得益于近年来 AIGC(AI-Generated Content)技术的持续发展,也对其他 AIGC 模型具有重要意义,尤其是依托文字、语音模态的类型。未来 OpenAI 可将ChatGPT与其他AIGC模型集成,拓展更丰富的功能和应用场景,进而助推AIGC浪潮、赋能整个 AI 产业链。Gartner 预计,到 2025 年 AIGC 将占据所有生成数据的 10%。据Frost&Sullivan 和头豹研究院测算,2021 年中国对话式 AI 市场规模为 82.7 亿元,到2026 年有望增长至 265.8 亿元,CAGR 达 26.3%。目前 ChatGPT 已被应用于多种工作职能中,基于其技术逻辑和特点,中短期内拥有多样化应用方向与场景,兼顾 To B 和 To C,具体主要包括:1)应用于内容创作)应用于内容创作,提升内容生产效率和丰富度:完成翻译、收集素材、选题策划、写作稿件等任务(例如美国新媒体巨头公司 Buzzfeed 宣布将用 ChatGPT 辅助内容创作,美联社使用的 Wordsmith 每秒可完成 2000 篇报道),在文艺、影视等领域,协助编写剧本和视频脚本,比如国内海马轻帆旗下的“小说转剧本”工具,已深度参与了 3 万多集电视剧和 8000 多部电影的剧本创作过程;与视频类 AIGC 集成,基于文字合成、剪辑视频以及生成虚拟场景等;2)在商务场景中,协助培训员工)在商务场景中,协助培训员工,运用其多轮对话能力担任智能客服协助营销、把握消费者需求,从而降低公司用人成本,例如亚马逊运用 ChatGPT 生成员工培训文档;3)在办公场景中发挥办公助手、语音转换文字、代码生成等功能)在办公场景中发挥办公助手、语音转换文字、代码生成等功能,比如微软计划将Office软件与ChatGPT,推出Microsoft Teams高级版(付费),可自动生成会议笔记;4)在工业场景中,与图片类 AIGC 整合、基于对话中的关键词辅助制作设计图,减少工程设计用时,比如 Jasper 旗下的 Stable Diffusion,可基于文本生成图像,采用了目前全球最大的开放图像-文本对数据集 LAION-5B,且生成效率提高 30 倍,Jasper 的付费用户目前有 IBM、Autodesk 等;5)此外,)此外,ChatGPT 在教育、工业、医疗等行业中也有较大应用空间在教育、工业、医疗等行业中也有较大应用空间,比如在教育场景中为学生批改作业、答疑、查漏补缺,在医疗场景中为患者预诊、录入电子病历等。海外主要玩家现状:海外主要玩家现状:现阶段海外 AIGC 赛道玩家数量较多,市场格局尚未定型。其中,领先的生成式 AI 公司除 ChatGPT 之外主要有 Stability AI、Jaspers AI 和 Midjourney 等,在文字、图片、音频生成等领域拥有独特优势,且已积累一定的用户规模。 28 Feb 2023 6 Table_header1 中国互联网中国互联网 海外主要海外主要 AIGC 玩家一览玩家一览 公司公司 主要产品主要产品 主营业务主营业务 财务财务&估值估值 Open AI ChatGPT,DALL E 2 对话、文本、图像生成 公司预计 2023 年收入达 2亿美元;估值 200 亿美元 Hugging Face Hugging Face 对话 估值 20 亿美元 Cohere Cohere 对话、文本生成 估值或超 60 亿美元 Anthropic Claude 对话、语言助手 估值 50 亿美元 A121labs Jurassic 对话 估值 6.64 亿美元 Jasper AI Jasper,Jasper Art 文本、图像生成 2021 年收入达 4500 万美元;估值 15 亿美元 Stability AI Stable Diffusion,Dream Studio 文字、图像、音频生成 估值 10 亿美元 Midjourney Midjourney 图像生成 每月收入 200 多万美元 Podcast.ai Podcast.ai 音频生成 DeepMusic DeepMusic 音频生成、歌词生成、作曲 SoundHound AI SoundHound AI,语音 AI 估值 10 亿美元以上 Meta Make-A-Video 基于文字生成视频 Google Imagen Video,Phenaki 基于文本、图片生成视频 信息来源:公司官网,海通国际 海外海外 AI 独角兽公司估值排名(截至独角兽公司估值排名(截至 2023 年年 1 月月 25 日)日)信息来源:CB Insights,HTI Stability.AI 公司致力于开发 AI 开源工具,于 2022 年 8 月推出了图像生成模型 Stable Diffusion,可根据关键词产生图片,图像文本对数量超过 5000 亿,在消费级显卡上生成的图像与 DALL E 2 品质相当,成为其主要竞争对手。Stable Diffusion 的程序代码免费、开源,允许所有用户使用、调整,也可根据自身需求开发应用,已有超 20 万用户运用其源码开发了图像、语言、音乐等领域的 AI 工具,目前各渠道的日活用户规模累计达 1000 万以上。此外,Stability.AI 还发布了 DreamStudio,使用门槛较低,没有编程背景的用户也能输入提示词精准生成高质量图像,最快仅需几秒,DreamStudio用户已超过 150 万,生成图像数量超 1.7 亿。目前 Stability.AI 公司估值约 10 亿美元。 28 Feb 2023 7 Table_header1 中国互联网中国互联网 DreamStudio 操作界面简洁清晰,参数面板易于操作操作界面简洁清晰,参数面板易于操作 信息来源:DreamStudio,HTI Jaspers AI 成立于 2021 年 1 月,主要针对商业营销用途,为商家和个人用户提供 AI 文字生成和图片生成功能。其中,文字生成工具 Jasper 可帮助用户生成营销文案、社交媒体文章、新闻稿、TikTok 视频脚本、邮件等文本,支持 29 种语言;附加功能图片生成系统 Jasper Art 可根据用户输入的文字生成图像,并能调整画法、风格,且拥有无版权图片库。据公司数据,使用 Jasper 生成文案初稿可节省 80%的时间,ROI 达400%。Jasper和Jasper Art均采用付费订阅制,其中,Jasper订阅服务分为Starter/Boss Mode/Business Mode 三档,收费标准分别为$29/$59/$499 每月。相比同业竞对公司,Jasper AI 的主要优势在于:1)集成大量机器学习模型,包括业界最新的语言生成模型 GPT-3.5(由 OpenAI 开发)和 BLOOM(由 Hugging Face 开发),文字出品质量较高;2)针对目标用户群体的需求特点对模型进行微调,提供大量实用模板、创作工具(例如翻译器、抄袭检验等),通过优化关键词生成更契合 Google SEO 规则的内容,且速度提升 5 倍,帮助用户增大流量曝光、改善营销效果;3)同时支持图文生成功能,为用户创作营销材料、文艺作品等带来便利,在电商、社媒、视频制作等多个新兴行业领域具有较高的商业潜力。Jasper 同时支持文本和图像生成功能同时支持文本和图像生成功能 信息来源:Jasper;HTI 28 Feb 2023 8 Table_header1 中国互联网中国互联网 2022 年 10 月,Jasper AI 宣布估值超过 15 亿美元,已获得 1.25 亿美元 A 轮融资,将用于打造核心产品、与更多应用整合以及收购Outrite(一款用于检查语法和风格的AI软件,全球用户数已超过 100万),计划于 2023 年整合两家公司的产品。据公司创始人透露,截至 2022 年 10 月,Jasper 用户数已超过 10 万;2021 年收入达 4500 万美元,预计 2022 年实现收入 7500 万美元以上,同比增长约 66%。Midjourney 是 AI 绘画赛道近期最受欢迎的应用,能根据输入的关键词生成高质量图像,现已嵌入 Discord 平台,用户基于该平台的 bot 机制提交 Prompt(即提示词)即可生成图片,目前已拥有 381 万用户。Midjourney 允许付费用户创作的图像用于商业用途,但若收益超过每月 2 万美元则需支付 20%作为分成,也可与公司官方协定分成比例。Midjourney 擅长人像生成,图像接近照片级品质,制作的 3D 艺术品也十分逼真、精细,在建筑设计、艺术创作等对图像质量、审美要求较高的领域拥有显著优势,应用前景广阔。据称,目前 Midjourney 每月收入约 200 万美元以上。Midjourney 各级套餐费用及功能权限各级套餐费用及功能权限 Free Trial Basic Plan Standard Plan Pro Plan Fast GPU Time 0.4 hr/lifetime 3.3 hr/month 15 hr/month 30 hr/month Relax GPU Time/mon-Unlimited Unlimited Purchase Extra GPU Time-$4/hr$4/hr$4/hr Work Solo In Your Direct Messages-Stealth Mode-Maximum Queue 3 concurrent Jobs 3 concurrent Jobs 3 concurrent Jobs 12 concurrent Fast Jobs 10 Jobs waiting in queue 10 Jobs waiting in queue 10 Jobs waiting in queue 3 concurrent Relaxed Jobs 10 Jobs waiting in queue Rate Images to Earn Free GPU Time-信息来源:Midjourney,HTI 2.细探细探 ChatGPT 出圈原因:爆款应用背后,长期技术拐点已现出圈原因:爆款应用背后,长期技术拐点已现 ChatGPT 在上线上线 5 日内突破日内突破 100 万注册用户万注册用户,超越 Facebook 和 Twitter(分别用时 10个月和 2 年),两个月内突破两个月内突破 1 亿用户,成为全球最快用户破亿的互联网软件亿用户,成为全球最快用户破亿的互联网软件,对比之下,TikTok 和 Instagram 分别用时 9 个月和 2 年半才实现亿级用户量。用户活跃度方面,据 SimilarWeb 报告显示,ChatGPT 在 1 月的日均访问量达到 1300 万人次。我们分析,ChatGPT 能够如此迅速火遍全球,主要得益于:1)ChatGPT 长期积累的技术优势;2)公司大胆尝试得到市场认可;3)科技巨头纷纷躬身入局,释放重视信号;4)大趋势上,AIGC 行业逐渐成熟。 28 Feb 2023 9 Table_header1 中国互联网中国互联网 平台突破平台突破 1 亿用户所用时间亿用户所用时间 平台突破百万用户所用时间平台突破百万用户所用时间 Source:UBS,HTI Source:Financial Review,HTI 2.1 技术上,多轮迭代训练后已具备先发优势技术上,多轮迭代训练后已具备先发优势 由 OpenAI 公司推出的 ChatGPT 在正式面世之前,GPT 家族已有三个基于 Transformer技术的自然语言处理模型,分别为 GPT-1/2/3,模型每迭代一次,参数量都在几何式增长,从最初的 1.17 亿增加到第三代的 1750 亿,GPT-3 已成为全球最大的语言模型之一。ChatGPT 使用的 GPT-3.5 模型是在 GPT-3 的基础上加入 Reinforcement Learning from Human Feedback(RLHF,人类反馈强化学习)技术和近段策略优化算法,其目的是从真实性、无害性和有用性三个方面优化输出结果,降低预训练模型生成种族歧视、性别歧视等有害内容的风险。ChatGPT 训练的过程主要有三个阶段。第一步是训练监督策略,人类标注员对随机抽取的提示提供预期结果,用监督学习的形式微调 GPT-3.5,生成 Supervised Fine-Tuning(SFT)模型,使 GPT-3.5 初步理解指令,这一步与先前的 GPT-3 模型训练方式相同,类似于老师为学生提供标答的过程。第二步是奖励模型,在 SFT 模型中随机抽取提示并生成数个结果,由人类标注员对结果的匹配程度进行排序,再将问题与结果配对成数据对输入奖励模型进行打分训练,这个步骤类似于学生模拟标答写出自己的答案,老师再对每个答案进行评分。第三步是 Proximal Policy Optimization(PPO,近段策略优化),也是 ChatGPT 最突出的升级。模型通过第二步的打分机制,对 SFT 模型内数据进行训练,自动优化迭代,提高 ChatGPT 输出结果的质量,即是学生根据老师反馈的评分,对自己的作答进行修改,使答案更接近高分标准。简而言之,我们分析,简而言之,我们分析,ChatGPT 的优势在于的优势在于,1)使用 1750 万亿参数的 GPT-3 为底层模型进行预训练,为全球最大的语言模型之一;2)算力上得到微软支持,使用上万片 NVIDIA A100 GPU 进行训练,模型的运行速度得到保障;3)算法上使用奖励模型和近端优化策略进行迭代优化,将输出结果与人类预期答案对齐,减少有害性、歧视性答案,使 ChatGPT 更拟人化,让用户感觉沟通的过程更流畅。2930415561707801020304050607080ChatGPTTikTokInstagramPinterestSpotifyTelegramUberGoogleTranslate月0.2 2.510244101020304050ChatGPTInstagramFacebookTwitterNetflix月 28 Feb 2023 10 Table_header1 中国互联网中国互联网 GPT-3.5 训练过程训练过程 Source:OpenAI,HTI 2.2 管理上,管理上,OpenAI 管理结构更为灵活,为大胆创新奠定了基础管理结构更为灵活,为大胆创新奠定了基础 在 ChatGPT 上线之前,许多科技公司也在培育 AI 语言模型。如 Google 一直训练的LaMDA 模型,在 2020 年开始训练,初代于 2021 年 5 月公布,但由于模型与谷歌的广告业务发展方向无法匹配,迟迟未推出。该模型使用1370亿参数,1.56万亿单词量,是 ChatGPT 的 5 倍。去年夏季曾传出新闻,Google 工程师因为认为 LaMDA 具有独立思想而被开除;CEO 桑达 皮查伊明确表示,公司将秉持对 AI 的原则(产品有益于社会发展、安全可靠、对人负责等)以及对信息完整度的最高标准来研发和开放 AI 产品,Google不同于其他初创公司,不能承担 AI犯下的错误对公司的信誉和其他倍受信赖的产品造成的影响,Google 对于 AI 产品的研发和开放持有十分谨慎的态度。既没有上市,也没有盈利目标的 OpenAI 则显得更为进取。ChatGPT 的前身 GPT-3 模型于2020年发布,在此模型基础上,公司加入 RLHF训练和PPO,培育出GPT-3.5 模型,该模型对应的 InstructGPT 在 2021 年 1 月开始内测,于 2022 年初对外公布,兄弟版ChatGPT 在 2022 年 11 月末正式推出,即 GPT-3.5 模型从灰测到对外公布仅用时不到 2年。公司能够快速且大胆推出 ChatGPT,除了基于 ChatGPT 本身的优越性能,也是为GPT-4 收集更多公开对话数据,继续扩大可用参数规模。尽管 ChatGPT 仍有明显缺陷,在推出后屡现“胡说八道”的情况,且面对复杂的数理化问题无法提供正确答案,但瑕不掩瑜,用户对于这位先行者的错误结果展现出更多包容,相比之下,Google 于2 月 6 日推出的 AI 对话机器人 Bard 由于答案出错,公司当日股价一泻千里。占据先发优势的占据先发优势的 ChatGPT 在面世后迅速风靡各行各业。在面世后迅速风靡各行各业。据 S 对超过 1 千名大学生调查显示,已有 89%的学生使用 ChatGPT 辅助完成作业,48%的学生在做居家测验时使用 ChatGPT,53%的学生将其用于写论文,22%的学生用于写论文框架;除了教育行业,广告从业人员、网文写手、探店博主等都在尝试使用 ChatGPT 辅助撰写软文和稿件。企业方面,微软已宣布将 ChatGPT 嵌入必应搜索引擎,未来会陆续整合进Windows 系列产品、Teams 和云服务;奢侈品电商寺库和美国著名媒体公司 BuzzFeed于近期宣布与 ChatGPT 开展业务合作;亚马逊员工也在 Slack 表示已经将 ChatGPT 应用在多种工作职能中,但目前律师警告员工勿将公司机密信息告诉 ChatGPT。 28 Feb 2023 11 Table_header1 中国互联网中国互联网 大学生使用大学生使用 ChatGPT 情况调查情况调查 Source:S,HTI ChatGPT 公开合作公司公开合作公司 Source:Microsoft,新浪财经,WSJ,海通国际 2.3 科技巨头躬身入局,发布重视信号科技巨头躬身入局,发布重视信号 在 ChatGPT 对外公布并成为全球热点之前,微软公司早在 2019 年已经投资 10 亿美元成为 OpenAI 的金主之一,并在 2020 年 GPT-3 发布时获得独家授权访问底层代码,将API整合到微软的产品和服务中。此次 ChatGPT走红,微软继续加码100亿美元投资。作为 AI 和搜索引擎两个领域的领军企业,Google 在 12 月 21 日发出红色警告,表示类ChatGPT 聊天机器人将会颠覆搜索引擎行业,对 Google 的广告业务带来重创,随后于2 月初,Google 宣布投资 4 亿美元在 OpenAI 的竞对公司 Anthropic,并推出 AI 聊天机器人 Bard,紧跟热潮。国内同样可见科技巨头如百度、阿里和京东等纷纷宣布打造类ChatGPT 产品,加速布局 AIGC 产业。科技公司入局时间梳理科技公司入局时间梳理 Source:界面新闻,TMT,OpenAI,Google,Techcrunch,CNET,Fortune,TechWeb,海通国际 89%48%53%22%0%10%20%30%40%50%60%70%80%90%100%完成作业居家测验写论文构建论文框架合作企业合作企业合作方式合作方式微软将ChatGPT嵌入Bing搜索将ChatGPT与Teams、Azure云、Windows系列产品整合BuzzFeed运用ChatGPT协助创作个性化内容寺库电商对AIGC和ChatGPT进行研究,实现与真人类似的互动对话,丰富相关内容时间时间事件事件2019/07/22 微软向OpenAI注资10亿美元2022/09/22 微软获得GPT-3底层代码的独家授权访问权限2022/11/30 ChatGPT面世2022/12/21 Google发出红色警告,宣布将围绕ChatGPT全面调整Google未来一年在AI领域的工作2023/02/04 Google宣布投资4亿美元在OpenAI的竞对公司Anthropic202

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开