温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
AI
模型
ChatGPT
取得
突破性
进展
国内
争相
发布
国信
证券
2023
WN5
请务必阅读正文之后的免责声明及其项下所有内容证券研究报告证券研究报告|20232023年年0404月月1919日日超配超配互联网行业专题报告:互联网行业专题报告:AIAI 大模型大模型ChatGPTChatGPT 取得突破性进展,国内大模型争相发布取得突破性进展,国内大模型争相发布核心观点核心观点行业研究行业研究海外市场专题海外市场专题互联网互联网互联网互联网超配超配首次评级首次评级证券分析师:谢琦证券分析师:谢琦联系人:陈淑媛联系人:陈淑媛021-60933157021-S0980520080008联系人:王颖婕联系人:王颖婕021-市场走势资料来源:Wind、国信证券经济研究所整理相关研究报告2023 年 3 月电商数据:-消费复苏强劲,线上渗透率继续提升2023-04-18互联网行业动态点评 2023-03-16互联网行业动态点评-2022 年 12 月电商数据:国内消费逐步回暖,零售线上化率进一步提升 2023-01-31互联网行业动态点评-2022 年 11 月电商数据:消费受疫情短期冲击明显,线上消费反弹快韧性强 2022-12-21互联网行业动态点评-电商双 11:行业增长趋缓,综合电商提升体验,直播电商继续抢占份额 2022-11-24大模型提升机器理解能力大模型提升机器理解能力,优化人机交互方式优化人机交互方式。AI 大模型是实现通用人工智能(AGI)的重要方向,包含自然语言处理(NLP)、计算机视觉(CV),多模态大模型等。ChatGPT 推出两个月MAU 突破1 亿,是自然语言处理领域突破性的创新,大力出奇迹后出现涌现能力,更理解人类语言。大模型“预训练+精调”即可对下游应用赋能。我们认为大模型优化人类与机器交互方式,是效率的革命。大模型是“大数据+大算力+强算法”结合的产物,对比国内外大模型,算力储备上国内并无短板;算法上 OpenAI 有先发优势;前期数据的丰富度和量对大模型的训练至关重要。百度文心大模型:包含百度文心大模型:包含NLPNLP、CVCV 等在内的系列大模型。等在内的系列大模型。文心大模型包含NLP大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等。与Bing 类似,文心一言有望优化C 端用户搜索、创作体验;ToB 方面,百度已开放大模型API 接口,在文案、AI 作画、开放域对话方面赋能企业。对于具体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。阿里巴巴通义大模型阿里巴巴通义大模型:由通义由通义-M6-M6 模型融合语言模型和视觉模型组成模型融合语言模型和视觉模型组成,率先率先应用在硬件终端天猫精灵和软件通义千问。应用在硬件终端天猫精灵和软件通义千问。通义大模型包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。在应用上,天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟”;对话式通义千问已经开始内测。腾讯混元大模型:采用热启动降低训练成本,文字视频等多领域表现优异腾讯混元大模型:采用热启动降低训练成本,文字视频等多领域表现优异,已在广告游戏等多场景落地已在广告游戏等多场景落地。目前腾讯混元大模型已在腾讯广告、内容创作、游戏、对话式智能助手等方面实现落地,大幅提升工作效率并降低成本。华为盘古大模型华为盘古大模型:基于基于ModelArtsModelArts研发设计的系列模型研发设计的系列模型,在物流在物流、药物研发药物研发、气象预测等多领域已实现落地。气象预测等多领域已实现落地。目前盘古CV 大模型已覆盖了物流仓库监控等领域;NLP大模型覆盖了智能文档检索、智能ERP 和小语种大模型;科学计算大模型则应用于气象预报、海浪预测等方面。字节跳动字节跳动AIAI 探索基础扎实,在语言大模型和图像大模型初步布局。探索基础扎实,在语言大模型和图像大模型初步布局。字节跳动AIGC 大模型将从语言和图像两种模态发力,预期在今年年中推出大模型。字节跳动在算力、算法、数据方面并无短板。目前模型可用于图文、视频内容生成等,飞书将推出智能AI 助手“My AI”。投资建议:投资建议:当前,各家公司开展新一轮AI 模型竞赛,希望借助大模型开展“模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素,重点关注在大模型领域有技术储备的国内公司腾讯控股腾讯控股、阿里巴巴阿里巴巴、百度百度等。风险提示:风险提示:AI 技术迭代进度不及预期;AI应用落地进度不及预期;政策风险;供应链风险等。重点公司盈利预测及投资评级重点公司盈利预测及投资评级公司公司公司公司投资投资昨收盘昨收盘总市值总市值EPSEPSPEPE代码代码名称名称评级评级(港元(港元)(百万(百万,港元港元)2023E2023E2024E2024E2023E2023E2024E2024E0700.HK腾讯控股买入365.43,497,06415.718.020189988.HK阿里巴巴-SW买入94.82,007,8916.77.612119888.HK百度集团-SW增持129.6362.4377.99.31412资料来源:Wind、国信证券经济研究所预测群内每日免费分享5份+最新资料 群内每日免费分享5份+最新资料 300T网盘资源+4040万份行业报告为您的创业、职场、商业、投资、亲子、网赚、艺术、健身、心理、个人成长 全面赋能!添加微信,备注“入群”立刻免费领取 立刻免费领取 200套知识地图+最新研报收钱文案、增长黑客、产品运营、品牌企划、营销战略、办公软件、会计财务、广告设计、摄影修图、视频剪辑、直播带货、电商运营、投资理财、汽车房产、餐饮烹饪、职场经验、演讲口才、风水命理、心理思维、恋爱情趣、美妆护肤、健身瘦身、格斗搏击、漫画手绘、声乐训练、自媒体打造、效率软件工具、游戏影音扫码先加好友,以备不时之需扫码先加好友,以备不时之需行业报告/思维导图/电子书/资讯情报行业报告/思维导图/电子书/资讯情报致终身学习者社群致终身学习者社群关注公众号获取更多资料关注公众号获取更多资料请务必阅读正文之后的免责声明及其项下所有内容证券研究报告证券研究报告2内容目录内容目录大模型概述:大模型概述:大模型提升机器理解能力,优化人机交互大模型提升机器理解能力,优化人机交互.5 5AI 大模型是实现通用人工智能(AGI)的重要方向.5大模型应用:“预训练+精调”即可对下游应用赋能,优化人类与机器交互方式.6大模型三要素:算力、算法、数据.9百度文心大模型百度文心大模型.1212模型简述:已拥有 NLP、CV、跨模态、行业等多个 AI 大模型场景.12模型 toC 应用:文心一言有望优化 C 端用户搜索、创作体验.13模型 toB 应用:开放 API 接口赋能企业,精调行业模型.14阿里巴巴通义大模型阿里巴巴通义大模型.1616模型简述:由通义-M6 模型融合语言模型和视觉模型组成.16模型应用:率先应用在硬件终端天猫精灵和软件通义千问.17腾讯混元大模型腾讯混元大模型.1818模型简述:热启动降低训练成本,文字视频等多领域表现优异.18模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本.20华为盘古大模型华为盘古大模型.2222模型简述:基于 ModelArts 研发设计的系列模型,NLP、CV 等方向性能优越.22模型应用:在物流、药物研发、气象等多个场景实现落地,极大提高行业效率.23字节跳动大模型字节跳动大模型.2424模型简述:AI 探索基础扎实,语言大模型和图像大模型初步布局.24模型应用:可用于图文、视频内容生成等,飞书将推出智能 AI 助手“My AI”.25投资建议投资建议.2727风险提示风险提示.2727免责声明免责声明.2828rQvMoMmMtNnNrNsRqRqPuN9P9R7NmOrRtRsRkPpPqMiNnPpPaQoPrNwMsOpPNZmOyQ请务必阅读正文之后的免责声明及其项下所有内容证券研究报告证券研究报告3图表图表目录目录图1:消费级应用达到一亿用户花费时长(月).5图2:ChatGPT 对话演示.5图3:ChatGPT 能力实现解析.6图4:训练大模型“预训练+精调”模式.6图5:OpenAI 宣布推出插件功能.7图6:Segment Anything Model(SAM)演示.8图7:大语言模型产品应用价值链与已渗透部分应用.8图8:生成式 AI 发展历程与 ChatGPT 的突出能力.9图9:主要数据集大小汇总(部分,GB).10图10:百度文心全景图.12图11:百度 NLP 大模型.13图12:中国大模型市场 2022 年评估结果百度.13图13:文心一言对话演示.14图14:百度文心大模型 API.14图15:百度文心行业大模型原理.15图16:文心行业大模型案例.16图17:阿里巴巴通义大模型系列架构.16图18:阿里巴巴通义-M6 发展历史.17图19:阿里巴巴深度语言模型 AliceMind.17图20:阿里巴巴通义-视觉大模型.17图21:鸟鸟分鸟基于通义大模型系列.18图22:鸟鸟分鸟 15 天训练流程.18图23:阿里巴巴通义千问.18图24:阿里巴巴通义千问百宝袋.18图25:HunYuan-tvr 在 5 个公开数据集上排名第一.19图26:HunYuan-NLP 1T 模型在 CLUE 总榜、分类榜和阅读理解榜登顶.19图27:HunYuan 大模型及解决方案.19图28:腾讯广告多媒体 AI 技术研究与应用情况.20图29:腾讯智能创作助手功能一览.20图30:腾讯游戏 AI 路网生成模型.21图31:腾讯混元助手项目组织架构.21请务必阅读正文之后的免责声明及其项下所有内容证券研究报告证券研究报告4表1:大模型比较.11表2:国内大模型概述.11表3:盘古系列模型应用场景和领域.23表4:相关公司盈利预测及估值.27证券研究报告证券研究报告大模型概述大模型概述:大模型提升机器理解能力大模型提升机器理解能力,优化优化人机交互人机交互AIAI 大模型是实现通用人工智能(大模型是实现通用人工智能(AGIAGI)的重要方向)的重要方向AIAI 大模型是实现通用人工智能(大模型是实现通用人工智能(AGIAGI)的重要方向。)的重要方向。AI 大模型是基于海量多源数据打造的模型。AI大模型具备通用、可规模化复制等诸多优势,是实现 AGI(通用人工智能)的重要方向。AI 大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。ChatGPTChatGPT 推出两个月推出两个月 MAUMAU 突破突破1 1 亿,是自然语言处理领域突破性的创新,进一步理解亿,是自然语言处理领域突破性的创新,进一步理解了人类语言。了人类语言。大语言模型(Large Language Model,LLM)是一种使用了大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT 在2022 年11 月底推出后,2023 年1 月的月活跃用户数已达1 亿,成为历史上用户增长最快的应用。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型,可以应对各种自然语言处理任务,包括机器翻译、问答、文本生成等。图1:消费级应用达到一亿用户花费时长(月)图2:ChatGPT 对话演示资料来源:Yahoo Finance,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理ChatGPTChatGPT 由由OpenAIOpenAI 研发研发,GPTGPT 模型已更新至模型已更新至GPT-4GPT-4,大力出奇迹后出现涌现能力大力出奇迹后出现涌现能力。GPT全称是 Generative Pre-trained Transformer,是OpenAI 开发的一系列延伸自转换器架构(Transformer)的自然语言生成模型。2018 年,OpenAI 推出GPT-1。2022 年11 月,OpenAI 推出了对话交互式的ChatGPT。ChatGPT 在GPT-3.5 之上用基于人类反馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入,使机器更理解人类语言,让 GPT 获得更逼真的结果。ChatGPT 在逻辑推理、上下文理解等方面的能力,是模型规模达到量级后“涌现”出的。证券研究报告证券研究报告图3:ChatGPT 能力实现解析资料来源:Natural Language Processing with Deep Learning,Jesse Mu,艾瑞咨询,国信证券经济研究所整理大模型大模型应用应用:“预训练预训练+精调精调”即可对下游应用赋能即可对下游应用赋能,优化人类与优化人类与机器交互方式机器交互方式大模型借助大模型借助“预训练预训练+精调精调”等模式等模式,用相比较大模型更少量的数据即可对下游应用赋用相比较大模型更少量的数据即可对下游应用赋能能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水平完成细分应用的任务。大模型增强机器理解力,优化人类与机器交互方式,提升信息处理效率。大模型增强机器理解力,优化人类与机器交互方式,提升信息处理效率。1 1)自然语言类大模型自然语言类大模型:人类可以用自然语言方式人类可以用自然语言方式,与机器形成交互与机器形成交互。ChatGPT 为自然语言方面的大模型应用,语言文本处理是人类世界最重要的工作内容之一,如果AI 能图4:训练大模型“预训练+精调”模式资料来源:IDC,百度,国信证券经济研究所整理证券研究报告证券研究报告够懂的人类自然语言,并与人类形成交互,将协助人类大幅提升语言文本处理效率,带来生产力效率提升。例如,ChatGPT 可以依托人类自然问答的方式,帮助人类完成回答问题、虚拟助手(计划旅行、预定餐厅、购买产品等)、创作、文本、编程、摘要等工作。我们也可以通过语言类大模型调用机器工具,大模型相当于人类助手。我们也可以通过语言类大模型调用机器工具,大模型相当于人类助手。根据微软论文Sparks of Artificial General Intelligence:Early experiments with GPT-4,GPT-4 能够根据人类指令推断出需要哪些工具,有效地解析这些工具的输出并适当地做出回应,而无需任何专门的训练或微调。2023 年3 月23 日,OpenAI 宣布推出插件功能,帮助ChatGPT访问最新信息、进行计算或使用第三方服务。据OpenAI官网,第一批支持ChatGPT第三方插件的网站共11 个,包含电商、预定航班、订购食材、检索实时信息、检索知识库信息等领域。2)视觉类大模型:视觉类大模型:与语言模型类似,视觉类模型需要完成对图片的理解。2023 年 4月6 日,MetaAI 在官网发布了基础模型Segment Anything Model(SAM)并开源,其本质是基于Transform 模型架构,可以对图像中的一切对象进行分割。交互方面,SAM可使用点击、框选、文字等各种输入提示,指定要在图像中分割的内容。精准分割为大模型图像理解的基础。图像理解可以在智能驾驶、图像识别、安防(人脸识别)等方面进行利用。图5:OpenAI 宣布推出插件功能资料来源:OpenAI 官网,国信证券经济研究所整理证券研究报告证券研究报告3)多模态融合多模态融合:多模态为语言、图片、音频等多个模态的感知和认知融合。多模态大模型能够让机器结合环境因素来模拟人与人之间的交互方式,让图像、文本、语音等模态之间的统一表示和相互生成。多模态融合也是各大模型着重努力的方向。当前,已有的大模型可在文本、图像等方面赋能,已有的渗透应用包括搜索引擎(Bing等)、办公工具(Microsoft 365)、企业服务应用、垂直领域应用(金融、电商等)等等。根据2023 阿里云峰会,阿里巴巴集团董事会主席兼CEO 张勇表示“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC 各方面技术支撑、大模型支撑重做一遍”。图7:大语言模型产品应用价值链与已渗透部分应用资料来源:艾瑞咨询,国信证券经济研究所整理图6:Segment Anything Model(SAM)演示资料来源:Meta,国信证券经济研究所整理证券研究报告证券研究报告大模型大模型三三要素:算力、算法、数据要素:算力、算法、数据大模型是大模型是“大数据大数据+大算力大算力+强算法强算法”结合的产物结合的产物。1 1)算力是算力是AIAI 发展的基础设施发展的基础设施,芯片至关重要。,芯片至关重要。算力的大小代表着对数据处理能力的强弱。芯片性能越好,大模型的处理能力越快。比如,黄仁勋在2023 年2 月财报会中表示“过去十年,通过提出新处理器、新系统、新互连、新框架和算法,并与数据科学家、AI 研究人员合作开发新模型,已使大语言模型的处理速度提高了100 万倍。”2 2)算法是)算法是AIAI 解决问题的机制,源于算法理论发展、迭代优化。解决问题的机制,源于算法理论发展、迭代优化。不同算法可以看做解决问题的不同路径,算法的优劣可以用空间复杂度与时间复杂度来衡量。例如,GPT是在 Transformer 模型基础上发展的,Transformer 由 GOOGLE 在 2017 年提出。Transformer 相比于传统的循环神经网络(RNN)或卷积神经网络(CNN),在处理长文本时具有更好的并行性和更短的训练时间。图8:生成式 AI 发展历程与 ChatGPT 的突出能力资料来源:艾瑞咨询,国信证券经济研究所整理3 3)数据是算法训练的养料数据是算法训练的养料,前期需要给模型喂养大量数据前期需要给模型喂养大量数据,形成模型理解能力形成模型理解能力,中后中后期数据质量决定了模型精度。期数据质量决定了模型精度。机器学习中要用标注好的数据进行训练,数据标注对未经处理的初级数据进行加工处理,转换为机器可识别信息,只有经过大量的训练,覆盖尽可能多的各种场景才能得到一个良好的模型。当前,数据的丰富度和量对大模型的训练至关重要,只有大量数据的训练,大模型才有理解能力涌现的可能。当前训练数据集来源多为公开数据,比如根据AlanD.Thompson 文章,列举的大模型的数据集包括维基百科、书籍、期刊、Reddit链接、Common Crawl和其他数据集等。中后期,高质量数据将提升模型的精度。比如更加事实性的数据将提升模型准确性,更加通顺的中文语言将提升模型理解中文语言能力。另外,高质量反馈数据也可提高模型性能,比如ChatGPT 采用人类强化学习RLHF,通过更专业的问题、指令、人类反馈排序等加强模型理解人类语言逻辑。最后,也可以通过更精准的垂类数据,完成部分更细分领域模型搭建。证券研究报告证券研究报告我们从以上三个维度,分析当前发布的部分大模型:1)算力:算力布局主要来源于芯片的采购布局,算力基础设施的投入阻挡了部分小公司的入局。当前数据训练需要较高性能的芯片完成对整体模型神经网络的训练构建,供应厂商包括英伟达等。应用层面只需调用整体大模型里的部分神经网络,故对芯片要求没有训练模型时那么高。2)算法:OpenAI仍有先发优势,GPT-3 之后并未开源。每家公司都有自己实现大模型的路径算法,由于GPT在成立之初就坚持自己的算法路径(采用单项Transformer 架构等),并在此基础上运用大量数据训练使得模型产生的涌现能力,取得了一定的成功,拥有先发优势。自 GPT-3 开始(2020年),OpenAI 便不再公布大模型相关训练及技术细节。虽然当前OpenAI 的成功提供部分借鉴,但其他公司仍需时间去研发追赶并进行模型迭代。除此以外,部分公司在特定领域拥有算法积累的先发优势,比如搜索类公司对语料的切割和识别有先发优势,视觉类公司在图像领域识别有先发优势。3)数据:当前中文语料规模与质量上不如英文语料。根据W3Techs,中文网站占全球网站数1.3%,英文网站占比 63.6%。除此以外,由于中国移动互联网发展较为成熟,大量的中文数据资源被存于各家企业或机构里,较难共享。图9:主要数据集大小汇总(部分,GB)资料来源:Alan D.ThompsonWhats in my AI paper,国信证券经济研究所整理;注:确定的数据以斜体表示。仅原始训练数据集大小。证券研究报告证券研究报告表1:大模型比较企业模型参数算力数据RLHF进度OpenAIGPT31750 亿上万块 GPU(V100)45TB 预训练22.11.30 日发布 ChatGPTGoogleLaMDA1370 亿1.56TB23.3.22 日发布 BardMetaLLaMA最大 650 亿RSC 超算平台1.4T token23.2.24 日发布微软Megatron-turing 5300 亿Azure 云平台3390 亿文本暂未公布产品百度文 心 大 模 型(ERNIW 3.0)2600 亿飞桨深度学习平台,百度云4TB(文本与知识图谱)23.3.16 日 发 布文 心 一言,23.3.27 日发布文心千帆大模型平台阿里M6超过 10 亿阿里云1.9TB 图像292GB 文本23.4.11 日发布通义千问腾讯混元2000 亿太极机器学习平台,腾讯云五大跨模态检索数据集暂未公布产品华为盘古200B鹏程云脑、ModelArts 40TB21.4 发布盘古大模型资料来源:OpenAI,Google,Meta,微软,文心大模型官网,通义千问官网,阿里巴巴官网,腾讯太极机器学习平台,华为云,国信证券经济研究所整理目前,国内已有百度、阿里巴巴、腾讯、华为等公司对AI 大模型进行开发,各模型系列主要的NLP语言大模型、CV大模型、多模态大模型也已推出并实现部分应用落地。此外,据36氪消息,字节跳动也在语言和图像大模型上有所布局,预期将于今年年中推出字节自研大模型。具体来看:百度在 AI 方面布局多年,具有一定大模型先发优势。当前,申请文心一言 API调用服务测试的企业已突破6.5万。在行业大模型上,已经与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生态和产品线,在出行场景、办公场景、购物场景和生活场景均有广泛应用。腾讯混元大模型已经在广告投放、游戏制作投入使用,目前集团在研究对话式智能助手,预计投入使用后将对QQ 和微信生态有一定优化。华为与B 端合作紧密,预计未来应用以ToB为主。此外,华为在算法、算力上储备较为丰厚。比如“鹏城云脑II”获全球IO500 排行五连冠,拥有强大的AI 算力和数据吞吐能力。华为云 ModelArts 平台的高效处理海量数据能力,7 天完成了40TB 文本数据处理。盘古大模型最早已经在2021 年4 月正式发布,当前盘古大模型训练文本数据高达 40 TB(GPT-3 为45 TB)。表2:国内大模型概述公司公司大模型大模型底层支持底层支持模型系列模型系列应用应用百度百度文心大模型飞桨深度学习平台,百度云文心 NLP 大模型(ERNIE 3.0)、文心 CV 大模型、文心跨模态大模型、文心生物计算大模型文心一言、开放 NLP 大模型 ERNIE3.0/跨模态大模型 ERNIE-ViLG/对话大模型 PLATO 的 TOB API 接口,赋能下游企业文案、AI 作画、开放域对话等方面阿里巴巴阿里巴巴通义大模型阿里云通义-M6、通义-AliceMind、通义-视觉大模型 天猫精灵、通义千问腾讯腾讯混元大模型腾讯太极机器学习平台,腾讯云混元 NLP 大模型、混元 CV 大模型、混元多模态大模型、混元文生图大模型腾讯广告、文涌(Effidit)、3D 虚拟场景自动生成、对话式智能助手华为华为盘古大模型鹏程云脑、ModelArts盘古 NLP 大模型、盘古 CV 大模型、盘古科学计算大模型“物的银行”、新药研发、气象预测字节跳动字节跳动字节跳动大模型 火山引擎语言和图像大模型抖音特效、剪映 AI 生成、飞书 AI 助手“My AI”资料来源:文心大模型官网,通义千问官网,阿里巴巴官网,腾讯太极机器学习平台,鹅厂技术派,华为云,36 氪,国信证券经济研究所整理证券研究报告证券研究报告百度文心大模型百度文心大模型模型简述模型简述:已拥有已拥有 NLPNLP、CVCV、跨模态跨模态、行业等多个行业等多个 AIAI 大模型场景大模型场景文心大模型拥有多个文心大模型拥有多个 AIAI 应用场景,文心一言是基于文心应用场景,文心一言是基于文心 NLPNLP 大模型的对话式产大模型的对话式产品品。根据官网介绍,文心大模型包含 NLP 大模型、CV 大模型、跨模态大模型、生物计算大模型、行业大模型等,分别可用于语言、图像、跨模态、生物、细分行业等。2023 年 3 月 16 日,百度正式官宣全新的生成式 AI 对话应用文心一言,是文心 NLP 模型应用下的产品。其能够与人对话互动,回答问题,协助创作。图10:百度文心全景图资料来源:文心大模型官网,国信证券经济研究所整理百度百度 NLPNLP 核心是核心是 ERNIEERNIE 模型模型。文心 NLP 大模型面向语言理解、语言生成等 NLP场景。百度文心 NLP 大模型打造了 ERNIE 模型系列,ERNIE 问世于 2019 年,目前发展至 3.0 版本。其中语言理解和生成包含 ERNIE 3.0 Tiny、ERNIE 3.0、鹏城-百度.文心、ERNIE 3.0 Zeus,另外文心 NLP 大模型包含医疗、金融等细分领域ERNIE 模型。ERNIE 3.0 Tiny(轻量级):可用于通用语言理解。ERNIE 3.0(百亿级):可用于智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务。鹏城-百度 文心(千亿级):模型参数规模达到 2600 亿(GPT-31750 亿),可用于舆情分析、智能创作、文本解析等。证券研究报告证券研究报告图11:百度 NLP 大模型资料来源:文心大模型官网,国信证券经济研究所整理文心大模型在国内市场格局中较为领先文心大模型在国内市场格局中较为领先。根据 IDC 发布2022 中国大模型发展白皮书,百度文心大模型在市场格局中在产品能力、生态能力、应用能力等方面在国内较为领先。文心一言文心一言核心优势是对核心优势是对中文的理解。中文的理解。百度作为中国语境的搜索龙头,拥有有更多的中文语料数据参与训练。比如,文心一言可以针对“洛阳纸贵”这种容易产生歧义的成语,给出较为贴切的解释。可以用成语写出藏头诗,用四川话读出文章。图12:中国大模型市场 2022 年评估结果百度资料来源:IDC,国信证券经济研究所整理模型模型 toCtoC 应用:文心一言有望优化应用:文心一言有望优化 C C 端用户搜索、创作体验端用户搜索、创作体验百度已经推出对话式产品文心一言。百度已经推出对话式产品文心一言。文心一言可通过对话模式,帮助用户文学创作、商业文案创作、数理推算、中文理解、多模态生成等。例如文心一言发布会上案例,文心一言可以生成 2023 世界智能交通大会海报,解答“智能交通最适合证券研究报告证券研究报告哪个城市发展”的问题,并用四川话和视频形式展现答案。我们认为,与 New Bing类似,百度可以将对话式人工智能功能添加至搜索引擎中,优化用户搜索、创作等体验。当前,在百度 APP 内,基于文心 ERNIE 大模型已实现新闻资讯信息的自动分类,新闻标题和摘要的自动生成等功能。模型模型 toBtoB 应用:开放应用:开放 APIAPI 接口赋能企业,精调行业模型接口赋能企业,精调行业模型目前目前,百度开放大模型百度开放大模型 APIAPI 接口接口,在文案在文案、AIAI 作画作画、开放域对话方面赋能开发者开放域对话方面赋能开发者和企业和企业。百度文心大模型开放了 NLP 大模型 ERNIE3.0、ERNIE-ViLG 文生图、对话大模型 PLATO。ERNIE 3.0 提供文案改写、开放问答、摘要、文案创作、小说创作、文本补全等文本理解与创作能力。ERNIE-ViLG 提供基于文本描述的 AI 作画能力。PLATO 提供生成式开放域对话服务,逻辑清晰、知识多元、情感丰富,闲聊能力接近真人水平。当前已经有 650 家企业宣布接入文心一言生态,还有更多的企业在排队。据百度介绍,申请文心一言 API 调用服务测试的企业已突破 6.5 万。图14:百度文心大模型 API资料来源:文心大模型官网,国信证券经济研究所整理图13:文心一言对话演示资料来源:文心一言发布会,国信证券经济研究所整理证券研究报告证券研究报告对于具体行业来说,对于具体行业来说,百度百度也推出文心也推出文心.行业大模型行业大模型,进行行业精调。,进行行业精调。行业大模型是在百度通用大模型的基础上学习行业特色数据与知识,建设行业 AI 基础设施。图15:百度文心行业大模型原理资料来源:文心大模型官网,国信证券经济研究所整理百度文心行业大模型以百度文心行业大模型以“行业知识增强行业知识增强”为核心特色。为核心特色。目前百度文心行业大模型在能源、金融、航天、制造、传媒、城市、社科以及影视等领域,与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。我们以五个行业场景举例:在燃气行业,“深燃-百度文心”在环境巡检、安全监控等领域落地,有效解决了场景繁杂、识别困难等难题;在汽车行业,“吉利-百度文心”应用于售后服务和汽领域知识库构建等场景;在保险行业,“泰康-百度文心”应用于医疗单据识别等任务,平均字段识别错误率相对下降;在电子制造行业,“TCL-百度文心”改变了传统质检算法流程,大幅提升了模型研发与运营效率,实现降本增效;在社科行业,“辞海-百度文心”用于版权保护、词条管理和知识挖掘等方面。证券研究报告证券研究报告图16:文心行业大模型案例资料来源:文心大模型官网,国信证券经济研究所整理阿里巴巴通义大模型阿里巴巴通义大模型模型简述:模型简述:由通义由通义-M6-M6 模型融合语言模型和视觉模型组成模型融合语言模型和视觉模型组成通义大模型最早发布于 2022 年 9 月 2 日,在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成,通义大模型实际上是由一系列模型组成,包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。图17:阿里巴巴通义大模型系列架构资料来源:机器之心,国信证券经济研究所整理通义系列前身为通义系列前身为 M6M6,是阿里达摩院研发的通用性多模态大模型是阿里达摩院研发的通用性多模态大模型,特点是训练能耗特点是训练能耗显著降低。显著降低。M6 自 2020 年初正式启动研发,于 2021 年 1 月/3 月/5 月分别发布百亿/千亿/万亿参数多模态预训练模型。2021 年 10 月发布十万亿参数模型,并且支持使用 512 GPU 在 10 天内即训练出具有可用水平的 10 万亿模型,同等参数下相较于 GPT-3 能耗降低 99%。证券研究报告证券研究报告图18:阿里巴巴通义-M6 发展历史资料来源:机器之心,国信证券经济研究所整理M6M6 融合语言模型和视觉模型,形成当前的通义系列大模型。融合语言模型和视觉模型,形成当前的通义系列大模型。2022 年 1 月,阿里M6 发布了统一大模型 M6-OFA,可以实现不同模型之间的模态表示、任务表示、模型结构的统一。以 M6-OFA 为统一底座,阿里巴巴将另外两大模型“AliceMind”“视觉大模型”与 M6 进行融合,形成了当前的通义系列架构。其中,通义通义-AliceMind-AliceMind 为深度语言模型体系,包含了通用语言模型 StructBERT、生成式PALM、结构化 StructuralLM、超大中文 PLUG、多模态 StructVBERT、多语言 VEC等多个不同模型,具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力;通义通义-视觉大模型视觉大模型包括文本到视觉生成、语言和视觉的模态映射两大基础模型,可以提供文生图等能力。图19:阿里巴巴深度语言模型 AliceMind图20:阿里巴巴通义-视觉大模型资料来源:AliceMind,国信证券经济研究所整理资料来源:机器之心,国信证券经济研究所整理模型应用:模型应用:率先应用在硬件终端天猫精灵和软件通义千问率先应用在硬件终端天猫精灵和软件通义千问硬件终端方面硬件终端方面:天猫精灵基于通义大模型推出拟声助手天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟鸟鸟分鸟”。4 月 4 日,脱口秀演员鸟鸟在微博发布了一条关于天猫精灵的演示视频。根据公司和鸟鸟的介绍,“鸟鸟分鸟”是天猫精灵联合阿里达摩院,基于通义大模型,对鸟鸟录制的一个多小时音频进行学习训练而成。从形态上看,“鸟鸟分鸟”本身是一个对话机器人,具备多轮对话能力,并且还能利用搜索引擎等工具。个性化是“鸟鸟分鸟”最大特点,具备拟人化的音色、语气、表达方式。我们推测,这意味着通用大模型将有可能在表达方式层面实现较低成本的定制化。证券研究报告证券研究报告图21:鸟鸟分鸟基于通义大模型系列图22:鸟鸟分鸟 15 天训练流程资料来源:机器之心,国信证券经济研究所整理资料来源:机器之心,国信证券经济研究所整理对话式通义千问已经开始内测,包含对话式通义千问已经开始内测,包含 9 9 款款“百宝袋百宝袋”小应用。小应用。4 月 7 日,阿里云宣布大模型“通义千问”上线,并定向邀请企业用户进行测试。测试版的通义千问与 ChatGPT 和文心一言在界面上相似,都是采用问答对话的形式。此外,通义千问在对话模式之外,制作了 9 款称为“百宝袋”的小应用,可以分为三类:1)效率类:写提纲、SWOT 分析、商品描述生成;2)生活类:会放飞的菜谱、小学生作文、然后呢;3)娱乐类:彩虹屁专家、写情书、为你写诗。我们认为,未来阿里大模型有望添加至阿里系电商和钉钉等场景中,带动用户体验和效率的提升。图23:阿里巴巴通义千问图24:阿里巴巴通义千问百宝袋资料来源:虎嗅,国信证券经济研究所整理资料来源:虎嗅,国信证券经济研究所整理腾讯混元大模型腾讯混元大模型模型简述:热启动降低训练成本,文字视频等多领域表现优异模型简述:热启动降低训练成本,文字视频等多领域表现优异“混元混元”AIAI 大模型大模型由由 TEGTEG 数据平台部和机器学习平台部联合主导数据平台部和机器学习平台部联合主导,涵盖涵盖计算机视计算机视觉觉、自然语言处理自然语言处理、多模态内容理解多模态内容理解、文案生成文案生成、文生视频等方向文生视频等方向。“混元”AI大模型由腾讯 17 级研究员/杰出科学家(腾讯史上最高专业职级)张正友博士带队,2022 年 4 月公司首次披露研发进展,目前已更新至 2.0 版本。性能上看性能上看,“混元混元”大模型在文字大模型在文字、视频等多个领域表现优异视频等多个领域表现优异。其中 HunYuan-tvr模型在文字和视频在全球最具权威的 MSR-VTT,MSVD,LSMDC,DiDeMo 和ActivityNet 五大跨模态视频检索数据集榜单排名第一,实现该领域的大满贯;HunYuan-NLP 1T 模型在 CLUE(中文语言理解评测集合)总榜、分类榜和阅读理解榜排名第一。证券研究报告证券研究报告图25:HunYuan-tvr 在 5 个公开数据集上排名第一资料来源:鹅厂技术派,国信证券经济研究所整理图26:HunYuan-NLP 1T 模型在 CLUE 总榜、分类榜和阅读理解榜登顶资料来源:腾讯太极机器学习平台,国信证券经济研究所整理技术上看技术上看,“混元混元”大模型基于腾讯太极机器学习平台研发大模型基于腾讯太极机器学习平台研发,通过改进模型与算通过改进模型与算法,大幅降低训练成本。法,大幅降低训练成本。HunYuan 利用千亿小模型帮助万亿大模型完成启动