全球首个AI生成3D虚拟主播参与新闻播报

最近一个AI生成的3D虚拟主播火了：输入文字，AI就能生成一个逼真3D数字人，口型精准、表情到位的将新闻播报出来。不仅可以坐着播，还可以站着播，甚至身体可以做出各种姿势动作。下面我们就来聊聊她背后的黑科技：「搜狗分身」！

近日百变新闻主播火了一把！

视频加载中...

她可以一秒换装、实时换发型，还可以同时穿梭在不同的虚拟演播室中。

她就是全球首个3D AI合成主播「新小微」。

在不需要后期填补细节的前提下，「新小微」就已经达到了非常逼真的效果，立体感和交互能力几乎和真人无二。甚至在特写镜头下，连头发丝和皮肤上的毛孔都看得清清楚楚。

轻轻松松无缝换装，西装外套像变魔术一样瞬间从蓝色变成了红色，简直是新闻界「百变小樱」。

不光能坐着播报，还能在虚拟直播间里走来走去。

实际上，「新小微」的诞生，是利用搜狗核心人工智能技术「搜狗分身」，在采集赵琬微真人海量数据的基础上，用AI算法生成的全球首个3D 虚拟主播。

只要输入文字，就能实时生成逼真的3D数字人视频，轻松做到对口型、秀表情、切机位。

全球「首个」3D AI合成主播：实时多景深切机位，业内第一家

当然了，「全球首个3D AI合成主播」的称号可不是随随便便就能叫的。

搜狗3D AI合成主播经受住了这次严峻的考验，在以下5个方面展现了过人的实力。

超写实

高清特写镜头下，「新小微」的皮肤材质、毛孔、牙齿、嘴唇、眼睛、头发都清晰可见；AI合成主播讲话时，语音和唇动配合十分默契，面部的肌肉运动也十分流畅。同时，AI主播的眨眼、头动、身摆也更接近真人。

3D场景

可以做到对3D数字人360度的展现、全方位的呈现，这使得未来可以运用在多机位、多景深的场景下。

实时文本驱动

「我只是给了她一段文字，她却还了我一段逼真的视频」。

搜狗AI技术已经拥有了给到一个文本，就能实时输出一个视频或者视频流的能力。请注意，它是实时的。

现在大家在游戏中、电影中看到的很多NPC人物或3D电影角色，他们可能都是3D建模的，但都需要在前期和后期投入了相当大的人力、时间、财务成本，才能保证模型足够的写实。

灵活可控

3D AI合成主播是一个完全参数化的、数字化的模型，基于这个模型可以让它做各种各样的动作，可以让他走路、做各种手势，同时头动、身体的运动都非常自然，具有很强的灵活可控性。

更强的灵活可控性，代表着这个数字虚拟人可以做出更多复杂的动作，从而适合更多的场景。比如做主播做新闻的时候，可以随时走动、做出各种肢体动作；做老师讲课的时候，可以跟学生互动，做手势等。

低成本迁移

将一个真人的各种数据做半自动化的数据标注，产生出大量的3D运动数据，结合语音数据、图像数据，共同做多模态建模，最后生成一个可驱动的3D数字人。

纯AI模型，效果远超传统3D建模技术

「搜狗分身」的AI硬实力，为传统的3D技术创造了无限的想象空间。传统写实类的3D模型，很多是采用blendshape或骨骼动画去做的。做AI的小伙伴可能不是很熟悉这两个产品，下面我们简单介绍一下。

blendshape是3d软件里用来做模型形变的一种技术，通过调整权重，设计师可以将目标模型变化成一系列预定义的模型，或者这些模型的任意线形组合。

骨骼动画模型是动画中的一种。在骨骼动画中，模型具有互相连接的「骨骼」组成的骨架结构，通过改变骨骼的朝向和位置来为模型生成动画。

但是，单纯用骨骼动画，模型中只有骨骼参与了移动，没有考虑肌肉协调身体其他部分（比如面部表情）的联动效应，做出的效果就没有这么逼真。

那么搜狗的3D AI合成主播是如何实现的呢？

首先，基于真人原型采集海量数据：真人赵琬微戴着数据采集头盔，几百个摄像头对其身体各个部位360度全方位「打点」扫描，采集每一处细节，并对其多种形态的表情和动作进行细致入微地捕捉记录。

其次，采用了行业领先的扫描还原算法，以及面部肌肉驱动、表情肢体捕捉等技术，生成高逼真度的3D 数字人模型。

最后，通过搜狗分身的多模态生成算法对3D数字人模型进行实时驱动、渲染，使其面部表情、唇动、肢体动作和语言表达能力实现了高度契合。

3D AI合成主播采用的是全球最领先的肌肉绑定3D模型，从面部表情到肢体动作的细节，达到了影视级作品及游戏NPC的写实度，有时候甚至更高、更自然。

纯AI驱动，真正实现了「降本增效」

实际上，游戏或电影里面早就有了类似的虚拟数字形象，那么跟搜狗的3D AI合成主播相比，有什么区别呢？

首先，游戏及电影行业多是靠人工驱动才能实现一个高写实的3D模型，需要投入大量的人力和财力成本。扫描一个人，再投入大量的人工，采集他讲的每一个字、每一个发音、每一个动作，靠美术师自己勾画出来，一点一点提升写实度，制作一个小时完整的3D写实视频，大约需要花几千万人民币。

游戏行业的专家，对AI主播的效果还是比较认可的。「如果想制作一个写实度这么高的3D视频，一分钟视频，一个专业的美术师差不多要花一个月的时间。」

其次，像现在市面上一些比较火的卡通形象（如洛天依）都是靠真人采集，没有做到真正意义上的AI驱动，搜狗AI很容易就能实现这种仿真的数字形象。

而「新小微」使用了端到端的模型，靠AI算法实时驱动。输入一个文本直接就能输出一个视频或者视频流，生成1分钟左右的视频，仅需要1分钟，总体来看效率几乎是实时的。

此次官方宣称的「全球首个」，是因为他们做了一个3D的、基于AI驱动的数字合成主播，这是全球首创的，而并非一个简单的3D虚拟形象。

更厉害的是，这个3D虚拟主播是在不输游戏中人物写实度的前提下，完全使用AI来驱动。

打造真正的「虚拟个人助理」：逼真、实时、可交互

说白了，3DAI合成主播只是一个演示案例。但这个案例，却是搜狗「以语言为核心的AI战略布局」的一次具象化体现。

使用「搜狗分身」技术，能够构建很多数字人的形象。利用这些所谓的「分身」，可以代替本人做一些重复性的繁杂工作，把人真正解放出来，有更多精力去做更多创造性的工作。目前「搜狗分身」已经具备了3个特点：

多领域。包括媒体、客服、司法等领域都得到了应用
可交互。作为一个真正的数字人，可以与人进行对话
多语种。不仅支持中文，还支持中英日韩俄五种语音播报

除了和新华社合作推出3D主播，搜狗还和平安普惠合作，将「搜狗分身」应用在面审客服上；和北京互联网法院合作，推出首个AI虚拟法官；搜狗自己还推出了自有IP主播「雅妮」，以及全球首个AI营养师。

显然，做虚拟主播并不是搜狗的真正目的，毕竟这个和他们未来目标相比，难度太低了！

他们真正想要的，是通过文本、语音、图像融合而成的高逼真数字人，让AI成为可交互、懂人言、拟人化的虚拟个人助理（VPA）。

今天的「新小微」在新华社做主播，明天的「新小微」在你身边做小助理。

这，才是真·智能个人助理。

展开阅读全文

页面更新：2024-03-14

标签：全球骨骼逼真肢体面部实时真人模型表情形象动作数字数据数码技术视频新闻

1 2 3 4 5

鹅鹅鹅，万万没想到，有人敢坑鹅

近几天，腾讯和老干妈的官司闹得沸沸扬扬简单概括一下这个故事：第一回合：腾讯说自家游戏“QQ飞车”去年和老干妈合作推广，至今被老干妈拖欠1600多万广告费未还，腾讯要求法院冻结老干妈1600万财产；第二回合：老干妈回应从未跟腾

荣耀X10发布，打响5G千元机第一枪

今天下午，荣耀X10正式发布，废话不多说，直接来看参数和价格外观上，荣耀X10采用6.63英寸2400*1080分辨率的LCD真全面屏，侧边实体指纹，升降弹出式前置相机，90Hz屏幕刷新率+180Hz触控采样率，值得一提的是，荣耀X10应该是目前唯一1

一把筋膜枪，戳破多少人的中产幻觉

你的筋膜枪，不比你妈的保健品强！ “筋膜枪到底值不值得买”，这已经是一个脱离日用语境的小资问题。愿意购买它的人，根本不屑于和你讨论这个问题，因为他们的消费主张从来就是“贵有贵的道理”；不会购买它的人，压根也没有想过

高通骁龙865Plus发布，魅族：演我？

两个月前，魅族营销负责人万志强信誓旦旦表示可是万总万万没想到昨晚高通的大手印就来了，啪啪的啊！骁龙865Plus，从名字也能看出，骁龙865+和去年的骁龙855+都只是提升了主频，而提升后的骁龙865+是手机SoC史上第一次突破3GH

它来了！维信诺全球首个可量产屏下摄像解决方案

进入全面屏时代后，各大厂商都在争相研究怎样搭载前置摄像头的情况下让屏幕更加完整、屏占比更大。于是乎减小挖孔、弹出式摄像头等设计纷纷出现，但依旧有其局限和不方便之处。而现今被认为最完美的解决方案——屏下摄像

上校改行，KFC要出游戏‘鸡’？

今年最让游戏宅高兴的事，莫过于是索尼PS 5发布了。然而要论最让游戏宅幸福的游戏设备，却并非索尼PS 5莫属。因为下面要讲的这台游戏设备，不仅可以供我们愉快的打游戏，还可以满足我们对食欲的追求。它就是KFC宣布推出的全

小米十年+超大杯发布会

虽然名字叫《小米10周年雷军公开演讲》...但实际上是：小米10周年辛酸史回顾 + 年中“超大杯”产品发布会。雷军，作为数码圈、歌手界、鬼畜区赫赫有名的大佬……虽然脱口秀实力没罗老师强，但演唱水平演讲功底还是很ok的

PS5正式发布，家里该换空气净化器了

6月12日凌晨,千呼万唤索尼终于公布了次世代主机PS5,并带来了《蜘蛛侠》新作、《GT赛车7》《瑞奇与叮当 Rift apart》《生化危机8》《地平线 Forbbiden West》《死亡轮回》《恶魔之魂重制版》等PS5平台的游戏。视频加

刚发射完火箭又要布局免费WiFi，马不停蹄

北京时间 5 月 31 日凌晨 3 点 22 分，在佛罗里达卡纳维拉尔角，全球最大的载人航天飞船「龙」载着宇航员成功上天了。如果本次计划圆满完成，SpaceX将完成人类历史上数个第一，说它改写了NASA甚至是美国的历史都不夸张。这

iQOO发布完美旗舰，iQOO5

8月17日iQOO在线上举办了新品发布会，正式发布了iQOO5系列（两款手机）。原本以为iQOO会等到明年的骁龙875再放大招，毕竟现在发布也只能用骁龙865，但没想到这次的iQOO如此激进：双曲面屏幕、120W闪充、三星GN1主摄....外观iQOO5

realme V5/vivo S7双双发布，外型亮眼

8月3日下午2点，Realme V5在线上正式发布，而晚上7点30，vivo S7也在线上发布。realme V5作为一款“不套娃”的手机，realme V5在外观方面做了很多改变。首先是在配色方面重新命名，提供银翼少年、破晓之光、青出于蓝三种配色

苹果发布会，iPhone12缺席

这几天一直有人说，此次苹果发布会没有iPhone12，只有新iPad和新Apple Watch。就连新iPad Air的外观造型，新Apple Watch多了个SE款都给透了个底朝天。不得不说，网络上那些大神们的爆料，真是越来越准了。今天凌晨，发布会如期举

Redmi 10X系列和K30系列品品谁更香

前天realme X50 Pro玩家版发布后，很多人都表示，红米10X性价比肯定会更高，因为红米的性价比一直都可以。但昨天红米10X发布后，很多人都表示失望，为什么会失望？看完你就懂了。外观&屏幕昨天红米共发布了三款手机，分别是红米1

马斯克发布脑机接口，超级大脑或将实现

在 Neuralink 总部的发布会活动上，借助小猪格特鲁德的实时神经元活动演示，马斯克向人们介绍了该公司的最新进展。Neuralink 由马斯克于 2016 年创立，总部位于旧金山，主要从事马斯克所谓的「神经织网」（neural lace）技术开发

摩托罗拉发布折叠手机，刀锋再现

9月10日晚，联想MOTO在国内正式发布了Razr 5G（刀锋5G）折叠屏手机，融合了5G+折叠屏当前两大热门技术，无缝、无折痕的设计带来了令人眼前一亮的颜值。MOTO的刀锋系列手机2004年发布，在全球创造了1.3亿的销量奇迹，轻薄造型独树一

上滑加载更多 ↓

全球首个AI生成3D虚拟主播参与新闻播报

超写实

纯AI模型，效果远超传统3D建模技术

纯AI驱动，真正实现了「降本增效」

打造真正的「虚拟个人助理」：逼真、实时、可交互

鹅鹅鹅，万万没想到，有人敢坑鹅

荣耀X10发布，打响5G千元机第一枪

一把筋膜枪，戳破多少人的中产幻觉

高通骁龙865Plus发布，魅族：演我？

它来了！维信诺全球首个可量产屏下摄像解决方案

上校改行，KFC要出游戏‘鸡’？

小米十年+超大杯发布会

PS5正式发布，家里该换空气净化器了

刚发射完火箭又要布局免费WiFi，马不停蹄

iQOO发布完美旗舰，iQOO5

realme V5/vivo S7双双发布，外型亮眼

苹果发布会，iPhone12缺席

Redmi 10X系列和K30系列品品谁更香

马斯克发布脑机接口，超级大脑或将实现

摩托罗拉发布折叠手机，刀锋再现

它来了！维信诺全球首个可量产屏下摄像解决方案

moto edge s正式发布，全球首发骁龙870

vivo X70系列正式发布，全球首款四摄防抖手机

全球首款屏下前摄折叠手机，三星Galaxy Z Fold3/Z Flip3

以色列军队惊现“隐身衣”，开启“魔法世界”的真人秀

一年129亿，《原神》全球手游吸金第一

上周全球游戏销量榜单：《死亡循环》大热

如何开发主机手游？云畅游戏技术负责人分享《鬼泣》手游

《怪猎崛起》玩家数据统计：一半玩家偏爱孤狼狩猎

新动作不断，揭秘极氪驶入行业超车道的秘诀