文本描述
\\\\\\\\\ \\
2023 年 2 月 9 日
招银国际环球市场 | 睿智投资 | 行业研究
中国互联网行业
优于大市
中 ChatGPT & AIGC 在中国市场的发展前景 (维持)
中国消费互联网高度普及率及不断提升的企业数字化程度将为 AIGC 产业提供 中国 互联网 行业
庞大发展潜力,中国市场的可变现的商用场景丰富且规模可观。龙头科技企业
例如阿里巴巴、百度和腾讯在几年前便开始部署 AI 及类 ChatGPT 技术发展, 贺赛一, CFA
在不久的将来会优先从企业端变现开始实现技术商业化。由于中国有丰富的电(852) 3916 1739
hesaiyi@cmbi.hk
商、教育、线上客服、金融、广告、软件开发、提升工作效率等商用场景,提
升工作效率和竞争力的诉求会加速该技术商业化渗透,我们认为长期来看 Chat陶冶
franktao@cmbi.hk
GPT 技术将与 AI 及云技术结合,MaaS 或为长期商业化方向之一。其他应用方
向还包括机器人、智能驾驶、服务系统、医疗医护服务、高端制造、成为内容陆文韬
工业化的核心引擎等。luwentao@cmbi.hk
ChatGPT 引领 AIGC 产业发展。 ChatGPT是 OpenAI 公司推出的文本生成类相关报告
1. Baidu (BIDU US) - Core business
预训练模型,相比于以往 AI 对话模型,ChatGPT在跟进问题、上下文语言理recovery on track with more to
解和拒绝不适当请求等多方面展现出显著优势,在上线短时间内吸引广泛关expect on new initiatives – 8 Feb
2023
注。ChatGPT 及其他 AIGC 大模型与应用在2022 年迎来加速发展,主因在应
用落地及技术迭代方面的重要进展。应用落地方面,ChatGPT 访问量在 23 年 2. BiliBili ( BILI US ) - Eyes on
monetization potential and margin
1 月已突破 6 亿人次,微软2023 年 1 月宣布进一步拓展与 OpenAI 合作并将 improvement trajectory – 7 Feb
其 AI 模型集成至其主要产品线。在技术迭代方面,ChatGPT及 AIGC 产业链 2023
的发展需要更好的大模型(Transformer/BERT/Ne)及更多优质模型的开 3. Baidu (BIDU US) - Factoring into
源)进行训练、更多的数据(GPT-3等文本大模型已突破千亿参数量)和更 near-term pandemic impact but
recovery is in sight – 20 Jan 2023
低的算力成本。所以在中国市场龙头科技公司拥有更强的技术迭代竞争实
4. Alibaba (BABA US) – Looking
力, 尤其是在芯片受限的情况下算力的提升需要比较高的投入。 beyond short-term pandemic
AIGC 产业化方向众多、前景广阔。我们认为 AIGC 在需要高效处理大量客户 impact – 12 Jan 2023
需求、创意性内容行业以及标准化生产行业均有较大的应用空间,在诸如归 5. NetEase – Preparing for next
纳性文字工作、代码开发相关工作、图象生成领域及智能客服等领域均有广strong product cycle – 18 Nov
2022
阔的产业化前景。我们认为中国领先的人工智能云厂商都有能力(数据、算
6. Tencent (700 HK)– Return to
力、模型)来提供类 ChatGPT 的服务,但因为各公司业务各有侧重,各厂商earnings growth track – 17 Nov
在 AIGC 领域的应用或形成差异化。如百度已宣布其类ChatGPT 产品“文心2022
一言”即将于3月推出;腾讯的混元大模型是集计算机视觉,自然语言理解,
多模态理解能力于一体。阿里巴巴“鹿班”可短时间内完成大量banner 图、
海报图和会场图的设计,有效提升工作效率。此外,模型训练成本快速下降
也有望为 AIGC 大规模商用提供支撑。目前我国相较国外在AI 算法和技术层
面存在差距,但在数据量及应用场景端相对占优,利用好场景及数据端的优
势有望助力缩小差距。
AIGC 产业链已见雏形。AIGC 产业链可划分为基础设施层、中间层及应用
层。1)基础设施层厂商主要为中间层及应用层厂商提供预训练模型等基础设
施,掌握 AIGC 核心模型和算法能力,具备较高技术门槛,主要通过开放 API
和提供 MaaS 解 决 方 案 进 行 变 现 , 典 型 企 业 包 括 OpenAI 、 谷歌、
DeepMind、百度和科大讯飞等;2)中间层厂商基于预训练大模型生成场景
化小模型,帮助不同垂直领域实现 AIGC 的快速部署;3)应用层厂商主要面
向 C 端提供 AIGC相关服务,典型企业包括微软、百度、阿里巴巴和腾讯等。
敬请参阅尾页之免责声明 1
请到彭博 (搜索代码: RESP CMBR <GO>)或 cmbi.hk 下载更多招银国际环球市场研究
报告
本报告摘要自英文版本,如欲进一步了解,敬请参阅英文报告。
扫码进群领取
1、优质研报免费获取,行业报告定期打包
2、每日推送行业最新深度研报(精选10篇)
3、最新行业报告、公司研究、专业大咖分享2023 年 2 月 9 日
ChatGPT:引领 AIGC 产业发展
ChatGPT(Chat Generative Pre-Trained Transformer)是 AI 研究公司 OpenAI 推出的文
本生成类预训练模型,采用Web 浏览器上的对话形式交互,不仅能满足与人类进行对话的
基本功能,同时能够回答跟进问题、承认错误、质疑不正确的前提和拒绝不适当的请求。
ChatGPT 还可以驾驭各种风格和文体,具备代码编辑能力、基础脑力工作处理能力等一系
列常见文字输出任务。
相比于传统AI 对话模型,ChatGPT 具备多项优势功能,从而实现应用价值和使用体验的显
著提升:1)能够认知自身不足并进一步提出跟进问题以更好解答用户问题;2)能够理解
上下文,实现连续对话,提高用户交互体验;3)能够质疑用户提出的不合理问题与前提假
设;4)能够拒绝用户提出的不合理/不合法请求与问题。
图 1:ChatGPT:功能特点
资料来源:OpenAI, 招银国际环球市场
相较于OpenAI 此 前 研 发 的 GPT 1-3 , ChatGPT 核 心 技 术 优 化 在 于 引 入 RLHF
(Reinforcement Learning from Human Feedback,人类反馈强化学习)的训练方式,从
而在训练中增强了人类对模型输出结果的调节,促使模型输出结果更具备理解性。RLHF
训练框架主要分为三步:1)在初步模型中 AI 训练师同时作为用户和 AI 角色,协助 AI 创作
期望的回答,通过监督学习的方式优化模型的输出结果;2)训练师根据模型对同一个提问
所做出的不同输出结果进行排序,并通过该数据训练出奖励模型;3)根据奖励模型对模型
输出的结果进行打分,运用强化学习算法 PPO 不断迭代和优化模型输出。
敬请参阅尾页之免责声明 2
2023 年 2 月 9 日
图 2:ChatGPT:RHLF 训练框架
资料来源:OpenAI, 招银国际环球市场
ChatGPT 等文本生成类预训练模型是AIGC 产业(AI-Generated Content,人工智能生产
内容)最早商业化落地的核心赛道之一。除了在文本领域的应用以外,AIGC 在代码、图像、
视频、游戏等多领域均有望落地应用,有望进一步升级内容创作方式,提升内容创作效率
和降低内容创作成本,长期来看内容创作质量有望高于相关领域专业人员。在中国消费互
联网市场,无论是社交还是电商领域,视频化的趋势和内容比例越来越高。所以消费互联
网产业将是AIGC 在中国市场落地的重要场景之一。
图 3:AIGC 相关应用领域
资料来源:红杉资本, 招银国际环球市场
敬请参阅尾页之免责声明 3
2023 年 2 月 9 日
ChatGPT & AIGC:2023年产业迎来加速发展
ChatGPT 等 AIGC 应用在 2022 年的迅速崛起受到广泛关注,主因在应用落地以及技术迭
代方面所取得的重要进展。在应用落地方面,AI研究公司 OpenAI 于 2022 年 11 月推出 AI
聊天机器人ChatGPT 引发全球广泛关注,在两周内吸引超过百万用户。根据 similarweb 数
据,ChatGPT 网站访问量在2023 年 1 月已达到 6.2 亿人次。此外,微软于 2023 年 1 月 23
日宣布进一步拓展与 OpenAI 合作并投资数十亿美元以加速AI 技术研发,未来微软将在其
消费者和企业产品线应用 OpenAI 所研发的各类AI 模型;2023 年 2 月 8 日,微软宣布将
GPT-4 模型集合至Bing 及 Edge 浏览器并开放小范围测试,预计在未来几周进行更大范围
的发布。
图 4:ChatGPT:网页应用月访问人次自上线后激增 图 5:Bing:GPT-4 功能集合演示
(mn)
700
600
500
400
300
200
100
0
Nov-22 Dec-22 Jan-23
资料来源:similarweb, 招银国际环球市场资料来源:微软, 招银国际环球市场
在技术迭代方面,ChatGPT 及 AIGC 整体产业链的发展得益于更好的模型、更多的数据、
更低成本的计算:1)模型方面:Diffusion Model(2015年)、Transformer Model(2017
年)、BERT(2018年)、NeRF Model(2020年)等模型的出现使得 AI 进入大量参数的
预训练模型时代;而且自2020 年以来,许多预训练模型逐渐开源,包括GPT-j、GPT-
NeoX、OPT、Bloom等,更多开发者可以参与到预训练模型的使用、优化与研发当中;2)
数据方面,自2015 年到 2020 年期间,用于训练大模型的计算量增加 6 个数量级,OpenAI
旗下 GPT-3 参数量达到1,750 亿,显著高于 GPT-1 的 1.17 亿参数量。部分预训练模型在
手写、语音和图像识别、阅读理解和语言理解等方面超过人类基准水平。3)更低成本的计
算:在模型不断优化、GPU性能提升和服务器成本优化等因素支撑下,整体计算成本有所
降低。
敬请参阅尾页之免责声明 4