百度集团研究报告:牵手AI,破局未来

(报告出品方/作者:国金证券,陆意,许孟婕)

一、搜索引擎龙头,以AI破局“未来“

1.1、搜索与营销为基,“云+AI+智能驾驶”逐步成为新驱动力

公司是国内搜索引擎龙头,全球最大的中文搜索引擎,目前除移动生态之外,公司在 AI 生态上也实现全栈布局。移动生态端:公司采取 X+Y 型战略布局,即“横向开拓用户规 模,纵向深耕行业垂类”的方式推进整个生态向服务化、人格化升级。横向上布局爱奇 艺、好看视频、百度贴吧、百度主站 APP、百家号等流量入口,扩大整体用户规模。

纵 向上布局垂直行业:包括知识问答(百度知道、百度百科)、医疗(百度健康)、金融 (度小满金融)、B2B(基木鱼、出海易、度小店)、教育(百度教育)、工具类(百度地 图、百度网盘、百度文库、百度有驾)维护生态护城河。AI 生态上:以百度智能云、百 度大脑等能力为底座,逐渐扩展出生态应用场景,主要包括三大类:1)以小度音箱等智 能家居场景;2)以百度希壤为代表的元宇宙场景;3)以百度 Apollo 造车及萝卜快跑为 代表落地的无人驾驶场景。

盈利模式:在线营销为主要盈利模式,近年业务重心转移,核心在线营销占比降低, AI 作为新驱动力带动业务收入占比提升。公司盈利主要来源于提供广告位及搜索广告竞价 排名的在线营销模式、以百度云为核心布局的 To B 云服务业务、爱奇艺分部的会员增值 服务及内容分发服务。公司以搜索引擎业务起家,在线营销业务布局较早,盈利模式成 熟,是目前公司的主要收入来源。从营收占比来看:公司盈利重心持续向云服务倾斜, 转型趋势明显。公司 AI 为核心驱动的云服务和其他业务(包括软硬一体的智能业务,包 含智能云、智能音箱与阿波罗自动驾驶等) 近年来实现快速增长 ,云服务 2020/2021/2022 营 收 分 别 为 91.73/150.70/177.21 亿 元 , 同 比 增 长 44.00%/66.29%/17.59%,未来随公司 AI 布局得更加完善,其业绩增长的驱动能力将不断 增强。

1.2、从掌握流量入口到错失流量入口,“AI+”时代流量入口有望重塑

阶段一:PC 时代——搜索引擎聚合用户需求,为该阶段流量入口。 2000 年 1 月公司成立,中国互联网刚刚起步,门户网站、搜索引擎为该阶段最具竞争力 的互联网产品。公司最早为搜狐、网易、新浪等门户网站提供中文网页信息检索服务, 2001 年面向 C 端发布搜索引擎。2002 年公司通过闪电计划拉平与 Google 引擎上的技术 差距,并完成了部分指标上的反超,迅速占据国内市场成为首选搜索引擎,百度、 Google、雅虎三强对峙。2002-2003 公司陆续发布搜索伴侣、MP3、图片、新闻、贴吧等 内容平台,维护用户流量护城河。

公司 PC 时代的成功主要取决于两点:1)搜索引擎技术的壁垒相对较高,创始人李彦宏 为技术出身,其超链分析专利及投票排名算法在市场中具备强竞争力。2)搜索引擎在此 阶段为互联网生态的主要流量入口:公司稳固头部流量入口后扩展内容生态,发布百度 贴吧,抓住 PC 时代的核心用户流量机遇。搜索引擎导流让百度贴吧用户具备“飞轮效 应”,从而击败当时天涯论坛、搜狐网、腾讯论坛、博客成为最庞大的兴趣社交内容平台。

阶段二:移动互联网时代——错失流量入口,业务增长陷入瓶颈。 2012 年 12 月,国内 4G 牌照发布,上网设备革新,用户流量逐渐进入手机端,公司在互 联网的竞争过程中逐渐掉队,未能抓住移动时代流量。进入移动互联网时代,腾讯发布 微信,阿里发布手机淘宝,移动互联网的 APP 生态使得搜索引擎为流量入口的效果大幅 减弱。 移动互联网时代公司多方位布局寻求破局机会,但未能赶上发展浪潮。 2012 年竞购高 德地图失败,成立 LBS 事业部、获得爱奇艺控股权益,布局视频业务。2013 年收购 91 无线,2014 年收购百度糯米,收购糯米布局 o2o、发布百度钱包打通生态、收购传课网,布局教育 2015 年 分别投资 Uber、携程,推出百信银行、成立移动医疗事业部,多领域 布局,但并未见明显成效,我们认为公司在移动端时代竞争力下降的原因在于:

1)布局落后,马太效应导致未能抓住流量入口,公司 2012 年的核心业务布局点仍然处 于 PC 侧,并且发力重点仍在于基于搜索引擎的营销工具和产品的升级,在移动互联 网爆发前夕未像 BAT 其他两家提早布局移动生态,布局各项移动端业务时已经落后 于腾讯及阿里。 2) 搜索在移动端重要性下降。 PC 时代,互联网公司的服务大多通过网页进行提供,公 司的搜索引擎成为核心流量入口,而移动时代的 APP 生态使得用户的具体需求分散 至各个垂类平台,垂类平台内各自形成自己的生态闭环,对网页导流的需求降低, 搜索在移动端的重要性走弱。

3) 移动互联网时代比拼的更加是商业模式,公司技术方面的核心优势难以体现。公司 以技术见长,本质观念落实在效率、能力上的提升。移动互联网时代核心是抓住 C 端流量的时间,而公司的搜索业务以效率为核心,搜索后未能有好的产品衔接形成 生态闭环,基于搜索去做外延产品的能力较弱,难以抢占用户的使用时间。公司在 移动应用领域的布局更类似 PC 端的移植,并未基于移动时代碎片化时间及相关交互 模式开发出诸如短视频等业务的创新性应用。

阶段三:AI+时代——拥有 AI 全栈底座,有望在此浪潮中突围。 传统移动端业务动力不足的情况下,公司以 AI 为切入点破局,重新调整战略重心。2013 年成立深度学习研究院;2016 年 9 月百度 AI 大脑面世、推出医疗大脑进军智能医疗; 2017 年月 4 推出 Apollo 自动驾驶平台,同年 7 月发布 DUER OS 布局智能驾驶。2018 年 公司成立智能事业生活群组、发布智能小程序平台、小度智能音箱,扩展智能家居场景。 2019 年发布飞浆深度学习平台夯实底层 AI 能力。

目前公司 AI 布局已初具成效:2021 年 Apollo Robotaxi 于北京、上海、长沙多地开放 试运营,2022 年 7 月百度世界大会发布无方向盘无人车 Apollo RT6,具备 L4 无人驾驶 能力,可应对复杂城市道路。 2023 年 3 月发布文心一言大模型,成为中国首个 Chat 类 聊天 AI,截至目前超过 650 家企业宣布接入文心一言,在 AI+浪潮中,流量入口有望重 塑,公司有望获取先发优势。

1.3、公司技术底蕴深厚,AI时代有望占得先机

公司早期起家依靠搜索引擎的高技术壁垒占据市场,CEO 李彦宏为技术出身也使得公司 对技术更为注重,研发投入上维持高占比。在人员构成方面:研发人员占据公司主要组 成部分,目前,公司研发人员数量占比超 60%。研发费用端:持续投入,近年来同比增 速较快,22 年受降本增效人员裁减研发费用绝对值有所降低。公司近 3 年研发费用率分 别达到 20%/19%/19%,高于其他国内头部互联网公司。

公司技术底蕴深厚,AI 技术方面布局长达 13 年。早在确立 AI 转型之前,公司在 NLP、 机器翻译、语音、图像、知识图谱、机器学习等技术方面就已经具备世界前列水准。公 司 2010 年 1 月开始探索人工智能,同年 10 月在掌上百度上线语音搜索。2012 年 11 月 公司上线了第一款基于 DNN 的汉语语音搜索系统,成为最早采用 DNN 技术进行商业语 音服务的公司之一。2013 年,成立了深度学习研究院(IDL),专注于开发深度学习算法。 2015 年,公司的语音识别软件实现了 97%的准确率,取得汉语语音识别技术重大突破。

领先的布局+深厚底蕴让公司在 AI 竞争时代具备技术核心优势。根据《中国人工智能专 利技术分析报告(2022)》,公司以 16754 件 AI 专利申请量、5705 件专利授权量位居国 内榜首,覆盖城市、交通、医疗、金融、工业、农业、教育等细分垂直行业。我们认为 AI 时代流量入口或重新洗牌,公司凭借技术优势有望重新塑造行业地位,抢占发展先机。

二、全栈布局AI打造第二增长曲线,“AI+”时代具备竞争优势

2.1、AI布局全面,长期技术积累+全栈自研能力有望取得先发优势

公司的百度 AI 大底座是国内首个全栈自研的 AI 基础设施,在“芯片-框架-大模型-垂直 行业解决方案”拥有全栈布局。一方面 AI 布局底层架构的构建需要资金和时间积累,公 司自 2010 年开始就布局,拥有长时间积累下的技术和底层资源;另一方面自研架构下底 层和上层设施的耦合度相对较好,公司从芯片到行业解决方案的智能化闭环路径能够上 承应用下接底座,使公司基础云业务与 AI 应用更为契合,实现端到端的优化。

我们认为无论是 AI 还是云服务市场都具备“飞轮效应”,公司在技术层面的提前布局一 方面让公司 AI 模型发布层面具备先发优势,另一方面 B 端行业用户也会更倾向于技术架 构更为完整的科技公司,领先构建垂直行业生态的同时,也可通过行业数据反哺模型训 练,形成良性循环。 公司的 AI 布局主要包括基础层、技术层和应用层 3 个层面: 基础层:以昆仑芯片为 AI 计算的核心,百度百舸 AI 异构计算平台提供包含计算(百 度太行)、存储(百度沧海)、加速、容器四大 IAAS 层核心套件赋能 AI 底层架构。

中台技术层:以百度 PaddlePaddle 深度学习框架+文心大模型为核心,能够实现从数据 准备、AI 模型训练、生产、部署、测试的全链路、批量化生产。 应用层:依靠公司十余年积累的行业数据,面向金融、能源、互联网、教育、运营商、 制造、政府等行业提供垂直行业解决方案。

公司坚持 “云智一体”战略,有助于后续云与 AI 商业化落地。组织架构上的统一有助 于推动云与 AI 商业化落地:对标海外公司,微软 2017 年成立 Cloud AI 平台部,2018 年旗下资深副总裁级科学家及相关团队调任微软云体系,推动 AI 和云加速融合,同时微 软云改名为微软云与人工智能事业部,在此之后微软云收入、AI 影响力逐年上升。2020 年 5 月公司将 ACG(百度云)、AIG、TG(基础技术体系),整合为“百度人工智能体系” (AIG),由王海峰统一负责,自 2020 年至 2022 年,实现了“云智一体 1.0”至“云智 一体 3.0”的进化。

2.2、AI大底座之飞浆PaddlePaddle:国内首个自研开源深度学习框架,迭代速度位居国内前列

PaddlePaddle 为国内首个自研开源深度学习平台,助力公司构建 AI 生态。深度学习框 架作为 PASS 层中台,上承行业应用,下接底层芯片架构,是智能时代的操作系统,降低 了 AI 开发难度,开发者可通过其各种接口调取相应能力从而提升开发效率。

PaddlePaddle 于 2016 年发布,最初用于促进公司内部机器学习和深度学习的应用和研 究。自 2017 年开始,PaddlePaddle 开源,并成为国内首个产业级深度学习平台,平台 集工具组件、端到端开发套件、基础模型生态系统、核心框架于一体:核心框架涵盖开 发、训练推理部署等细分领域,具备大规模分布式训练技术及产业级数据处理等训练, 以及端边云深度优化的高性能推理能力。基础模型库包含经典的自然语言 PaddleNLP、 计算机视觉 PaddleCV、语音技术 PaddleSpeech 和推荐技术 PaddleRec 及文心大模型。

端到端开发套件则包括语义理解、图像分类、目标检测等开发套件。工具与组件包括强 化学习、联邦学习、图神经网络,科学计算、量子机器学习、生物计算的工具组件及预 训练模型应用工具、全流程开发工具、可视化分析工具以及安全隐私工具、资源管理与 调度等等,能够让科技工作者和开发者简洁快速地进行技术创新和应用实践。公司的 PaddlePaddle 自发布以来经过多次版本迭代,目前底层搭建完备,具备良好的开 发者和企业应用生态。截至 2022Q4,平台上模型创造数量超过 67 万,开发者累计数量 超过 535 万,使用企业数量超过 20 万。

PaddlePaddle 在 Github 使用人数、贡献者人数和技术迭代速度上国内大幅领先,仅次 于海外一线平台 Pytorch 和 TensorFlow。根据《2022 深度学习平台发展报告》,近年来 飞浆平台发展增速加快,2022 年贡献人数增速达 60.80%,关注度增速 37.60%,超过国 内外其他平台,有望进一步缩短与国外头部深度学习框架差距。目前生态完善,使用率 位居国内第一,根据信通院数据,截至 2022 年 12 月,百度飞桨已经成为中国深度学习 市场应用规模第一的深度学习框架和赋能平台,汇聚 535 万开发者,服务 20 万家企事业 单位,基于飞桨构建了 67 万个模型。

2.3、AI大底座之文心大模型:涵盖四大行业基础模型及垂直细分领域,降低AI应用开发者门槛

文心平台利用公司自研的深度学习平台飞桨打造,提供 AI 大模型与行业大模型,开发平 台与开发工具,产品与社区等一站式 AI 开发服务。旗下 “文心一言”作为国内首款正 式发布的生成式语言大模型,拥有文学创作、商业文案创作、数理逻辑推算、中文理解、 多模态生成等功能。

百度文心 ERNIE 最早源于 2013 年公司推出的神经网络语义匹配技术,其最初被用于改进 搜索结果相关性,经过内部锤炼后对外开放。最早以公司核心技术的 NLP 模型为主, 2019 年先后发布 1.0 及 2.0 版本,2.0 版本基于持续学习的语义理解预训练框架,使用 多任务学习增量式构建预训练任务,在模型的效果上超越 Bert。随后不断向外延展至各 大 AI 基础领域和垂直行业(例如 2021 年 5 月开源的多粒度语言知识增强模型 ERNIEGram、长文本理解模型 ERNIE-Doc、融合场景图知识的跨模态理解模型 ERNIE-ViL、语 言与视觉一体的模型 ERNIE-UNIMO 等)并最终形成了目前 AI PAAS 文心平台架构。

文心大模型体系提供包括 NLP、CV、跨模态、生物计算等四大 AI 核心应用领域的基础大 模型及各细分垂直行业模型:文心 NLP 模型:是公司的核心 AI 技术领域,应用于语言理解、语言生成等 NLP 场景,具 备超强语言理解能力以及对话生成、文学创作等能力,在不同垂类功能场景上布局不同 侧重功能点语言大模型: 1) PLATO:主要侧重人机对话领域,具备全球领先的开放域对话大模型,具备多轮流畅 的聊天能力。2021 年 9 月,公司发布了 PLATO-XL,为全球首个百亿参数的中/英对 话大模型。 2) ERINE-Search:侧重开放域搜索领域,基于预训练语言模型(PLM)的神经检索模型, 并创新性地引入自动态蒸馏方法和结合级联蒸馏过程,提高了双编码器作为检索器 的有效性。

3) ERNIE-M:侧重跨语言领域场景,通过对 96 门语言的学习,使得一个模型能同时理 解 96 种语言,该项技术在 5 类典型跨语言理解任务上刷新世界最好效果。 4) ERINE-Code:侧重于自然语言代码生成,具备跨多种自然语言和编程语言的语义理 解和生成能力。在代码生成任务、代码搜索任务,多语言代码摘要和代码文档翻译 等多个公开的评估基准上取得领先效果。

5) ERINE 3.0 Zeus:综合开放问答、信息抽取、情感分析、语义匹配等各类 NLP 任务 能力,是百度文心旗下最先进的千亿参数自然语言大模型,提出了层次化提示 (Prompt)学习技术,将百余种不同的场景任务统一为自然语言形式,进一步提升 下游任务建模能力。模型在文本分类、匹配、推理、识别、分析、生成等多个领域 的领小样本/零样本学习能力领先行业其他大模型。 6) ERINE3.0 Tiny:ERINE3.0的轻量级版本,通过模型裁剪、量化感知训练、 Embedding 量化等压缩方案,在保持模型精度不降的情况下,完成模型的推理加速、 内占用降低、体积缩小,将大模型由原先的GPU场景下放至CPU 场景,拓宽应用面。

文心 CV 大模型:主要基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开 发者提供强大的视觉基础模型,以及一站式应用服务。文心 VIMER-UFO 2.0 是文心旗下 目前最先进的统一任务大模型,主要应用场景为智慧城市。整体具备包含 170 亿参数, 多个任务的数据训练一个功能强大的通用模型,可被直接应用于处理人脸、人体、车辆、 商品、食物细粒度分类等 20+ CV 基础任务。模型首创针对视觉多任务的超网络与训练 方案,支持各类任务、各类硬件的灵活部署,在解决子任务过程中无需调用全体神经网 络,而只需抽取部分节点,而抽取的单任务模型只包含 6 亿参数,基于单任务模型抽取 的芯片级模型参数量可进一步降低到 1 亿规模模型,大大减少计算量,加速比近 30 倍。

其余 VIMER-CAE、VIMER-StrucTexT 2.0、VIMER-UMS 分别覆盖图像分类、图像监测、分 割;OCR 文字识别;商品识别零售快消等其他行业常用场景,整体布局完善。

文心跨模态大模型:基于知识增强的跨模态语义理解,实现跨模态检索、图文生成、图 片文档的信息抽取等应用的快速搭建,帮助产业智能化转型。旗下最先进的模型 ERNIEViLG 2.0:应用场景为图像生成、艺术创作、虚拟现实、AI 辅助设计。采用基于知识增 强算法的混合降噪专家建模,是全球首个知识增强的 AI 作画大模型,在文本生成图像 上超越了 Stable Diffusion、DALL-E 2 等模型,取得了当前该领域的世界最好效果, 并在语义可控性、图像清晰度、中国文化理解等方面展现出了显著优势。旗下剩余的 ERINE-VIL、ERINE-LAYOUT、ERINE-Layout、ERINE-SAT、ERINE 则分别覆盖视觉、文档、 语音、地理等多个跨模态垂直领域。

文心生物计算大模型:融合自监督和多任务学习,并将生物领域研究对象的特性融入模 型,构建面向化合物分子、蛋白分子的生物计算领域预训练模型。HelixGEM-2、 HelixFold-Single-HelixFold 分别应用于小分子药物研发、蛋白质结构预测等细分领域, 赋能医药场景。 文心行业大模型:文心官方与各行业企业联手,在通用大模型的基础上学习行业特色数 据与知识,建设的行业 AI 基础设施。目前文心官方共发布 11 款行业大模型,涵盖能源、 金融、航天、传媒、城市、社科、电影 8 个行业垂直领域。

目前国内大模型市场中,文心一言在产品能力、生态能力、应用能力上表现突出,属于 第一梯队,下游应用厂商相继接入后续有助于其完善 AI 应用生态。2023 年 3 月,公司 Chat AI 机器人“文心一言”发布,截至目前已有超过 650 位生态合作伙伴宣布接入, 涵盖传媒、互联网、金融、消费、教育、求职、营销、生物、文物、能源、光电等多个 行业垂直场景,有望丰富公司 AI 生态合作伙伴,拓宽 AI 赋能的行业场景。

2.4、AI大底座之昆仑芯:生成式AI催生算力需求,昆仑芯适合多种AI场景

生成式 AI 催生较大的算力需求。芯片在AI中主要用于处理人工智能应用中的大量计算 任务的模块(其他非计算任务仍由CPU负责)。部署在云端的 AI 芯片,注重算力、扩展 能力,以及它对现有基础设施的兼容性,移动端的AI芯片则更为注重低功耗、低延时、 低成本。

公司较早布局 AI 芯片研发,目前已推出相对成熟的二代产品。2011 年公司开始布局 FPGA AI 加速芯片,2017 年发布昆仑芯 XPU 架构。目前芯片产品历经成熟迭代,首款昆 仑芯一代 2018 年 7 月发布,并于 2020 年量产,目前在用的昆仑芯二代,采用 7nm 架构, 配备 GDDR6 高速显存,内存带宽可达 512GB/s,采用新一代昆仑芯 XPU-R 架构,通用 性和性能显著提升,可提供 256TOPS@INT8 以及 128 TFLOPS@FP16 ,功能上支持虚拟化、 芯片间互联、视频编解码等完备功能,性能上相较昆仑芯一代上提升 2-3 倍。目前昆仑 芯与产业链上下游已经逐步构建起软硬一体化的 AI 芯片生态,产品已经与百度飞桨、 PyTorch、TensorFlow 等主流框架和服务器完成适配。

昆仑芯在提升 AI 经典负载性能和算法性能加速能力较好。根据百度昆仑官网数据,以推 理场景中的吞吐率为例:在应对当前常见深度学习算法 GENM 和 ResNet-50、Bert、 Yolov5 上表现不俗,对典型 AI 的负载性能提升在 1.6 倍左右。昆仑芯在公司搜索业务上已有较多部署,适用于大多数 AI 落地场景,并与飞桨 PaddlePaddle 共建生态。过往 3 年昆仑芯在公司搜索业务持续上量,在推理领域部署的 比例远超 50%。公司在 Encoder 和 Decoding 的优化技术已经沉淀为重要基建,并把 Transformer 相关的优化技术沉淀出来跟飞桨 PaddlePaddle 做全面整合,融入飞桨 PaddlePaddle 生态。公司的商业、飞桨和昆仑芯通力合作,能更早深入理解新的 AI 场 景,并设计出有竞争力的软硬件产品,持续保持竞争力。

2.5、大模型在公司生态内具备落地场景,有望加速云智一体化变现进程

公司传统业务搜索引擎以及新兴业务智能驾驶、智能云、智能硬件等均为大模型实际应用落地场景,一方面大模型的开发可以最先应用于公司内部产品应用,另一方面公司产品的应用将对大模型后续开发和应用思路形成指导作用,在此基础上不断迭代优化,吸引更多生态伙伴。

随着文心一言通过百度智能云对外提供服务,云智一体的行业新格局有望重塑:通过云 计算与人工智能(AI)的融合创新,打造智能基础设施和通用 AI 产品,降低企业获取 和使用 AI 的门槛。过去云厂商格局上 AI 与云普遍处于两个不同体系,售卖计算、存储 等资源型产品是主要商业模式,而当前背景下:云计算与 AI 模型深度融合,AI 模型与底层架构整体配置耦合度更强,更受企业的青睐。我们认为云智一体化的有望推进将算 力、框架、模型,场景应用融合打造为标准产品,云业务格局有望从 IAAS 层、PAAS 层 转向 MASS 层(模型及服务)。

行业布局上:公司通过实践中积累起来的解决方案,覆盖工业、金融、能源、智慧城市、 数字人等各成熟垂类行业。22 年 9 月智能经济高峰论坛上,行业垂直应用再度升级:首 次发布汽车云,从车企集团云、网联云、供应链协同云,解决汽车行业生产、自动驾驶 测试、供应链管理三大数字化应用难题。中国销量前 15 的车厂,百度智能云客户占比 10 家,头部新能源车企服务 5 家。在产业金融方面,公司智能云推出产业数字金融方案, 涵盖普惠金融、绿色金融、农业金融,支持全行业跨越“数字鸿沟”。未来云业务的核心 竞争力将由模型能力、框架架构、底层芯片及顶层垂直应用的协同能力共同决定,公司 依托其自研全栈 AI 架构有望占得生态布局先机。

三、大模型赋能搜索业务升级,搜索有望再度成为流量入口

3.1、搜索引擎龙头,应用ChatGPT或可带动公司流量回拢

公司的搜索引擎国内处于龙头地位,市占率长期保持高位,但移动互联网中不同内容和 服务供给形式使得搜索引擎的广告变现能力有所减弱。根据 Statcounter,自 Google 退 出中国市场后,百度搜索引擎国内市场市占率始终保持第一,但步入移动互联网时代后, 短视频、电商、社交等不同类型生态聚拢用户流量,抢占用户使用时长,根据国金指数, 百度系 APP 用户使用时长占比从 2019 年 9.1%降至 2023 年的 6.5%。在此情况下广告主预 算发生一定转移,使得搜索广告市场份额持续收窄,根据中关村在线营销数据,搜索广 告的市场份额已从 2018 年的 21%,降至 2022 年的不足 10%。公司在线营销业务主要依赖 于公司的搜索引擎,在搜索广告被抢占市场份额及近两年疫情情况下公司在线营销业务 陷入负增长。

ChatGPT 提升人机交互体验,或可帮助公司回拢流量,提升市场份额。ChatGPT 上线后, 仅用 2 个月时间月活跃用户数就实现破亿,根据 SimilarWeb,2023 年 1~3 月, chat.openai.com 网站流量实现快速增长,3 月浏览量环比增长 56%。

2 月 7 日,微软推 出由 Chat GPT 加持的 NewBing 后,根据数据统计机构 data.ai,截至 2 月 9 日,Bing 应 用程序的全球下载量增长 10 倍,申请用户数量超过百万并位列 App Store 最受欢迎的免 费应用榜的第十名,日活用户突破 1 亿人,与此同时谷歌搜索页面访问量则下降 1%,搜 索应用下载量减少 2%。根据 Statcounter,2023 年 3 月 Bing 的搜索引擎国内市场份额 也出现明显提升。3 月 29 日,谷歌宣布正式开放生成式 AI Bard 的 Beta 测试版,首先 将面向美国和英国地区启动。我们认为 ChatGPT 有望重塑流量入口格局,而搜索引擎或 最先受到影响,若公司不跟随 ChatGPT 浪潮与搜索引擎结合,则其市场优势地位可能会 受到挑战,若公司将 ChatGPT 与搜索引擎业务相结合并探索出新的服务提供方式,则有 望帮助公司获取用户流量和使用时长,抓住成为新一代流量入口的机会。

3.2、“生成式AI+Plugin”或可打破搜索引擎仅B端付费的商业模式,实现B+C付费

目前公司的搜索引擎客户为各行业广告主,C 端免费使用通过 B 端广告变现。公司的 P4P 服务链接广告主与搜索用户,广告主付费后主要通过竞价排名的方式向搜索用户展示其 广告,在此过程中,搜索用户免费使用搜索引擎,付费者为广告主。

生成式 AI 的生成能力+Plugin 或可延长用户对搜索引擎的使用时间,形成“搜索+答案+ 聊天+创造/转化”生态,从而突破搜索引擎以往仅 B 端付费的商业模式,探索出“B+C” 付费模式。过往用户使用搜索引擎从搜索需求出发,当搜索到所需信息后仍需跳转到其 他应用来实现进一步需求,而生成式 AI 在理解用户需求后,除了帮助用户生成相关回答、 内容外,还可以接入第三方应用从而满足用户的最终需求。我们认为一方面 ChatGPT 与 搜索引擎结合或能催生以下变现场景:1)为搜索引擎提供新的广告形式,如在对话框下 方加入精准广告推荐;2)向接入 Plugin 的第三方应用收取渠道费用;3)向 C 端收取订 阅制会员收费或按服务类型收费,以获取更高的使用权限,如更快的响应速度、更丰富 的生成内容。

3.3、带动搜索引擎效果优化,关联查询更加精准

AI+搜索引擎使得搜索引擎对用户需求更具理解力,从而提供更为精确的查询结果。AI 大模型经过大量数据训练,具备了较强的泛用语义理解能力,能够更好地理解用户的问 题,传统搜索引擎主要通过“关键词”、“近义词”匹配和简单逻辑判断来呈现搜索结果, 不具备对问题的理解能力。


四、大模型赋能智能驾驶业务,有望助力公司在智能驾驶领域保持优势地位

4.1、行业发展迅速,大模型有望加速L4级别自动驾驶商业化落地

自动驾驶的推进的依靠 AI 技术、芯片算力、感知技术及配套设施,近年来随核心技术与 基建完善,整体市场目前增速发展。自动驾驶技术水平根据自动化水平从 0~5 级共分为 6 个层级,目前较多车企已具备 L1、L2 的技术积累,能够将其应用于汽车生产并量产, L3 级别的自动驾驶也在部分新型车企和部分老牌车企的部分车型中有所应用,大模型能够在感知技术、数据挖掘与标注方面推动更高级别自动驾驶商业化的落地。

自动驾驶行业快速发展,L2 级别自动驾驶渗透率迅速提升,后续 L3/L4 渗透率有望加速 提升。自 2021 年开始,行业增长加速,根据艾媒咨询,2025 年无人驾驶汽车规模将达 到 267.6 亿元,自动驾驶整体渗透率有望达 34.2%。细分层级来看,需要人工辅助驾驶 的 L2 级别自动驾驶,在芯片算力、AI 技术和感知技术上的要求更低,目前方案更为成 熟,渗透率已经较高,未来对技术要求更高的 L3/L4 级别自动驾驶将是竞争关键。

4.2、公司智能驾驶软硬一体布局,通过Apollo开放平台形成智能驾驶生态

公司自 2017 年开始宣布 Apollo 开放计划,Apollo 是公司的自动驾驶开放平台,能够帮 助汽车行业及自动驾驶领域的合作伙伴结合车辆和硬件系统,快速搭建一套属于自己的 自动驾驶系统,公司将自身自动驾驶技术和数据开放给业界,旨在建立一个以合作为中 心的生态体系,发挥公司在人工智能领域的技术优势,为合作伙伴赋能,共同促进自动 驾驶产业的发展和创新。目前 Apollo 已成为全球最活跃的自动驾驶开放平台,开源代码 数量超过 75 万行,覆盖超过 165 个国家、拥有超过 220 个生态伙伴、10 万个开发者。

自研技术沉淀至 Apollo 开放平台,8.0 版本更加生态友好。主要分为 3 个阶段:1)第 一阶段:从 1.0 封闭场地循迹自动驾驶到 2.0 的简单城市路况,Apollo 搭建了基础的自 动驾驶基础能力;2)第二阶段:从 2.5 限定区域视觉高速到 6.0 EDU 的教育专版, Apollo 积累了丰富的场景能力;3)第三阶段:从 7.0 开始,Apollo 专注提升工程易用 性,从开发者实际需求出发,帮助更多开发者更好更快的使用 Apollo。当前的 8.0 版本 由硬件设备平台、软件核心平台、软件应用平台和云端服务平台四层组成,能够帮助开 发者从 0 到 1 快速部署自动驾驶系统。

公司的优势在于智能驾驶布局全面、市场布局早、自研造车方案成熟三大方面: 1)智能驾驶布局:公司在自动驾驶汽车布局追求软硬件服务一体化,打造“基建-车-出 行”完整体系,涵盖算法模型、AI 基础设施、量产车、高精地图、V2X 自动驾驶全面能 力。基建:以百度智能云为代表,打造“端+云+内容”的车联网平台。车:包括智能车 舱和整车体系,其中智能车舱涵盖智能助手(小度语音 OS、百度地图,),智能驾驶(自 动驾驶平台萝卜快跑、解决方案 Minibus、技术 MASS,泊车 AVP 端,行车 ANP 端)以及智慧交通引擎(百度 ACE 智慧交通方案)。出行:主要基于 Apollo Robotaxi(无人自动 驾驶出租队)开展应用。

2)布局较早:先发优势明显,在数据、经验和生态伙伴积累上具备优势。2013 年百度 开始研发自动驾驶技术,2017 年宣布 Apollo 计划,出行上:全无人自动驾驶出行服务 广受好评的同时规模快速增长。根据公司公告,百度自动驾驶出行服务平台萝卜快跑累 计订单量已超 200 万,APP 用户满意度评价达 4.9 分,其中 5 分满分好评占比高达 94.19%。车企合作上:汽车智能化解决方案已在 30+个汽车品牌的 130+车型上实现量产, 累计搭载超 700 万辆。 3)自研造车方案成熟:目前百度 Apollo 汽车进行了多轮迭代,目前最新产品为第六代 量产无人车 Apollo RT6,作为全球第一款量产的无方向盘的自动驾驶车,Apollo RT6 实 现了 100%车规级和整车全冗余系统,成本为行业的十分之一。

公司于 4 月 16 日发布城市智能驾驶产品 Apollo City Drive Max,搭载轻量级地图产品, 整体内存占比低于传统高精地图近 80%,形成覆盖“驾-舱-图”的完整自动驾驶链路。 驾驶:四大方案涵盖高速、城市、泊车多垂直场景;座舱:小度车载 OS 作为整包方案, 能快速搭载量产,小度语音 SDK 则基于大模型本地化部署,能实现全时全双工、百毫秒 级响应。地图:车载导航地图、人机共驾地图、高精地图分别应对不同自动驾驶场景, 满足产品差异化需求。行泊一体产品 Apollo Highway Driving Pro 完成产品升级,能在 更低算力、更低成本条件下实现更高阶的行泊一体功能。

4.3、大模型应用有望赋能自动驾驶业务,感知和数据挖掘有望受益

大模型落地有望从技术能力上提升公司业务竞争力。目前自动驾驶的核心技术依次可以 分为环境感知、决策规划和控制三大部分,文心大模型的应用有望感知、决策、路径规 划方面做出优化。 感知侧:提升远视距感知能力。

公司感知系统历经三层次迭代:1.0 版本主要以激光雷 达点云感知,2.0 版本增加了环视图像感知,与激光雷达点云感知形成了两层的感知融 合。3.0 版本自研了毫米波点云感知算法,形成了三层感知的融合,而传感器融合是实 现 L4 自动驾驶的必要条件,其一大行业痛点在基于不规则条件下的感知、标注和数据挖 掘。针对感知和数据标注,公司利用文心大模型自动驾驶感知的技术,来提升车载小模 型的感知能力。感知需要标注大量的数据,2D 标注数据通常容易获得,3D 标注数据难求, 公司采用迭代的自训练方案,充分利用 2D 标注数据和 3D 非标注数据,提升训练效率能 力,新模型的效果在感知、预测车辆的距离等方面提升明显。

长尾数据挖掘:基于弱监督训练挖掘长尾数据提升训练效果。大模型可以实现直接通过 文本进行挖掘,将物品输入至文本编码器形成一个文本特征向量,然后通过快速的向量 搜索算法,在底库里面很快找到可能是该物品的图像出来,找到物品图像后可以把图像 输入到图像编码器里面抽取视觉表征,然后类似的进行向量搜索。随着搜索增加带来的回传图像数量增加,可以训练 fine classifier 完成进一步筛选,最终不断地提升数据 挖掘的效果。公司发布的文心大模型-图文弱监督预训练模型,背靠文心图文大模型数千 种物体识别能力,大幅扩充自动驾驶语义识别数据,针对少见的异型车、各色行人、低 矮物体及交通施工元素,提升识别能力。

路径规划方面:以百度地图为核心,大模型的应用有望提升规划效率及用户体验。目前 公司已发布文心交通大模型,创新性地将 Transformer 应用在交通领域将时序与交通道 路拓扑结合,构造了大量的交通规律学习任务,泛化大模型的使用场景,总体提升通行 效率达 15%-30%。具备生成式 AI 具备跨模态、跨语言的深度语义理解与生成能力,降低 百度地图用户的时间成本约 70%。文心交通大模型依托北斗高精实时接入空余车位、空 余充电桩、交通信号灯等动态信息,实时更新路径规划,提高用户体验感。目前,文心 交通大模型车位覆盖破百万,车位级导航平均节省 76.9%的找车位时间,全国新能源充 电桩覆盖率超 99%,红绿灯覆盖率超 95%,助力全国 35 座城重点路口平均等灯时间下降 约 10%。

五、盈利预测

我们预计公司 2023、2024、2025 年营收分别为 1370、1518、1670 亿元,其中百度核心 业务部门营收为 1059、1183、1321 亿元,爱奇艺业务部门营收 318、342、357 亿元。

1)百度核心部门:在线营销仍然将占据将作为公司主要的营收驱动力,过往几年由于疫 情影响在线营销收入存在较大波动,预计 2023 年随疫情好转,广告主广告预算增加,公 司在线营销业务将回归正增长,由于短视频广告目前在互联网广告中占比逐渐增加,预 计公司以搜索为主的广告形式增速短期仍将维持在较低水平,随生成式 AI 带动的流量聚 拢效应及新的广告变现模式影响,广告营销在后续有望收益。未来公司核心业务重心将 向云业务转移,AI 驱动的业务收入占比将持续增高,预计 2023 年云服务收入增速加快, 疫情好转将推动以 To B 业务模式为主的项目落地加速,大模型等新技术对算力需求增加、 各行业 AI 渗透率的提升将带动云业务增长,此外自动驾驶、智慧交通的快速发展将拉动 云业务的快速增长。

2)爱奇艺分部:预计后续驱动主要来自于会员费提价和广告收入,目前公司会员数量较 为稳定,预计后续会员收入增长主要由提价驱动;随宏观经济市场回暖,广告主整体投 放意愿及预算提升,广告大盘有望整体收益,长视频广告增速可能低于行业增速。爱奇 艺是目前为国内三家头部长视频平台之一,主要营收来源为提供会员增值服务,近年来 商业化进程加速。2020 年至今:2020 年 11 月、2021 年 12 月、2022 年 12 月,爱奇艺连 续三年调整会员费用,连续包月价格从每月 15 元增长至 25 元。长视频平台竞争的核心在 于内容的丰富度和独有性,根据云合数据《2022 年连续有效播放榜单》:有效播放榜单 前 20 剧集中爱奇艺拥有 14 个的播放权,其中作为独播平台的数量为 9 个,优质内容带 动公司 22Q4 订阅会员净增 1100 万,同比+15%,创历史新高。

毛利率:我们预计公司 2022、2023、2024 年毛利率分别为 49.91%,51.19%,52.18%, 毛利率提升原因主要是 1)公司将长期践行“降本增效”政策,以基本盘移动生态系统 继续产生强劲现金流,为智能云及智能驾驶业务的投入提供资金,智能云及智能驾驶业 务后续变现能力增强将带动毛利率优化;2)爱奇艺分部:公司近年自制剧集能力凸显, 输出的爆款内容原创占比较高,自 2022Q1 以来平台自制内容账面净值占整个影视剧净值 比例皆保持在 60%以上,平台 2022H2 上线的《苍兰诀》《罚罪》《卿卿日常》《风吹半夏》 《回来的女儿》皆为爆款自制剧集。

经营费用:预计随疫情回暖业务开展,公司销售及管理费用将有所增加,但在坚持降本 增效前提下,预计销售及管理费用率水平低于 2021 年,我们预计公司 2022、2023、 2024 年销售及管理费用率分别为 17.18%,17.56%,17.63%;公司为研发驱动型,研发投 入稳步提升,在降本增效大背景下其研发投入仅有少量收缩,预计在业务回暖、大模型 等新技术开发下,公司研发投入将有所增加,我们预计公司 2022、2023、2024 年研发费用率分别为 18.72%,18.28%,18.19%。根据以上假设,我们预计公司 2023~2025 年净利润分别为 151、186、219 亿元,NONGAAP 净利润分别为 224、255、292 亿元。百度核心净利润分别为 137、163、188 亿元, 爱奇艺净利润分别为 15、23、30 亿元。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】「链接」

展开阅读全文

页面更新:2024-05-28

标签:布局   牵手   模型   生态   能力   未来   搜索引擎   业务   智能   集团   行业   技术   公司

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top