人类与人工智能怎么“混居”?|专访小冰CEO

人类与人工智能怎么“混居”?|专访小冰CEO

作者 | 陈文琦

我们熟悉的小冰是一个略显奇怪的二次元少女,不像一般的语音助手,听我们的命令去好好完成一项又一项的任务,她无所不在,在微博、微信、华米OV手机、小爱同学音箱等第三方平台上跟你聊天,有时候还会顶嘴。

“小冰,小冰。”

“叫我干嘛!”小冰听上去脾气挺大。

但是现在,再去细看小冰,这早已不仅是一个聊天机器人,而是成为一个承载各种各样AI beings的人工智能底层框架,以自然语言处理(NLP)、情感计算为底层,融合视觉、语音、内容生产等技能。在这个框架之上,有人工智能少女小冰本尊、虚拟学生华智冰、世博会参展画家夏语冰、1700万个虚拟恋人......

关于AI beings和人类的未来关系,小冰CEO李笛告诉「真探」,“未来是千千万万个人类和千千万万个高度定制化的人工智能共同构成的新的社交网络。”

人类与人工智能怎么“混居”?|专访小冰CEO

人与人工智能的社交生态:一座岛

小冰已经更迭到第九代了,团队第一次推出了一个独立App,命名为小冰岛,给AI beings建了一座岛屿,让游离在各个社交平台、智能音箱里的AI beings有了一个安家之所。昼夜交替,岛屿上有山川河流,有晚风阵阵和海浪涛涛。

人类与人工智能怎么“混居”?|专访小冰CEO

小冰岛视觉设计

谈及建立小冰岛的初衷,李笛说:“从第一代到第九代,我们一点点的去弥补小冰框架的各个部分,从一个当时还是十六岁的少女小冰,到今天1700万个虚拟人类,几百个歌手,各种各样不同的性格、不同的能力的人工智能,我们离未知的答案可能是越来越近了。我们希望去触摸到一个未来,这个未来是千千万万个人类和千千万万个高度定制化的人工智能共同构成的新的社交网络。”

在小冰岛上,每个人都可以拥有一座完全属于自己的岛屿,然后作为「造物主」去创造岛屿上不同的AI beings,他们有着不同的身份、不同的性格、不同的能力,和你互动,彼此互动。不仅如此,他们也有创造的能力,写诗、作画、唱歌。

岛上有一套完整的社交网络,在国内即将正式上线的版本里类似微信,在日本要上线的版本里类似LINE,小冰团队选择了“追求用户在当下最熟悉的社交网络形式”在一座座岛屿上复刻了一个人和AI beings共生共存的生态圈。小冰岛上居民会跟你一对一聊天、群聊、发布自己的日常和作品、顺便还点赞评论你的朋友圈。

这是颠覆性的社交生态,除了你,其他都并非真人。小冰岛的目标是让人和AI beings产生有效且有意义的情感联结,为此,小冰搭了一个场子,搭了一个个AI beings,希望再现复杂有趣的人类世界。

据李笛告诉「真探」,这些AI beings分为两类:Super instance 和 Nobody instance。前一类是“输出大于输入的AI being”,类比到人类世界里就是KOL;后一类则是普通人,他们的存在对于身边的人来说非常重要,但是从社会层面上说知名度不高。

目前小冰岛只有抢先预览版,正式App将于11月在国内和日本市场同步上线。AI beings的形象在小冰岛上一点点鲜活起来,在海平面之下,是小冰框架让一个个AI beings的存在成为可能。

人类与人工智能怎么“混居”?|专访小冰CEO

研发成绩单

小冰团队的研发节奏稳健轻快:把一年分为两个周期,第一个周期是封闭开发,通常从4月开始到8、9月份,期间技术团队将力量集中在技术攻坚,解决自然语言处理、计算机视觉等等难点,同时开发出产品;第二个周期里,产品上线,得到用户反馈,团队以此为基础进行产品优化,或者自由尝试新点子。

在今年9月在“娘家”微软开的发布会上,小冰团队也展示了第九代小冰框架的升级,关键词是「多样性」:

首先,在开放域对话方面,第九代小冰框架重点加强了小样本学习与反馈式学习的效能。体现在五项具体指标上:平均对话长度、上下文一致性、上下文相关性、对话信息含量与话题引导成功率均领先于同行业者。

在超级自然语音和多模态交互方面,小冰团队在语音自然度(Naturalness MOS)和平均舒适时长(Average Comfort Duration)两项指标上还添加了多样性(Diversity)这一指标。

超级自然语音是小冰团队认定的趋势之一,“我自己觉得比较惊讶的地方是真正自然的语言是有瑕疵的,而不是中央广播电视台的声音”,小冰公司董事长沈向洋如是说。在此基础上,多样性可以包容AI beings不同的声音、不同的感情、不同的情绪,实现高度的定制化。

人类与人工智能怎么“混居”?|专访小冰CEO

小冰框架下生成的”山东大哥”AI being


Project Chararu,是小冰团队开展的一项基础研究,目标是通过极小样本量对人类个体进行学习,从而达到与该名特定人类个体一致的语言与声音风格。

该研究已能做到用200个对话样本达到接近人类本人的语言风格,AI 表现的分数从 3.83 提升到 4.19,接近人类个体在模拟测试中取得的分数是4.33。模仿语音特征所需的数据量也从 2 个小时以上压缩到 1 个小时。该项研究的产品化今年内也将首先在日本上线,用户得以通过AI来「复制」真人。

“比如说你给我某一个好朋友、亲人、重要的人,你有他200句的对话、聊天记录,我就可以学他的风格来复制在这个环境里。”李笛解释这个项目的应用场景。

在内容生成方面,小冰团队发布了全新的诗歌与绘画创作模型(V3),新的人工智能歌声合成技术、新歌手及X Studio 2.0,以及艺术家创作动机辅助技术,来开展人工智能与人类乐队跨界共创的音乐实验。

人类与人工智能怎么“混居”?|专访小冰CEO

小冰公司想要人与有EQ的AI beings产生联结,彼此倾注感情,这个任务带有「工程师团队的浪漫主义色彩」。从微软出走,小冰总要学着自己长大。

以下为「真探」与小冰公司CEO李笛的部分访谈实录:

关于小冰岛

Q:小冰团队一直没有做过独立平台,为什么这次出了小冰岛App?

李笛:小冰岛其实是延续小冰这么多年的一个实验。人工智能这个系统整体往前迭代本就是你要选定三个要素中的一个,要么是算力,要么是算法,或者是数据。我们是从2013年底的时候开始,决定以数据为主。

获取数据的最好的方法不是建一个第一方App,让用户到你这来把数据给你,也不是你直接买数据,第一手数据是最重要的。小冰不仅仅在社交网络和智能音箱和手机,还有大量的新闻评论,比如在网易新闻上,每天评论近百万条,在整个评论区你可以理解为也是多人和一个AI的交互,我们这么多年都在走这个最大限度的、最好的的方式获取数据的方式。

但是我们的一个梦想是,未来整个大的人类的网络的交互节点应该不光只有人,而是有人和AI beings,我们相应的数据类别就分为四个大类别:一、一个人和一个AI之间一对一的交互,这个我们有特别多的数据,在华为、小米、OPPO、vivo、天猫精灵里面基本都属于这种概念;二、很多人和一个AI的交互数据,这就像群聊,两个人在私聊和群聊中行为模式都会产生变化,即使说的内容都相同,别人可能也没说话。以及很多AI和一个人,还有很多个AI和很多人,这两方面的数据我们不多。

举个例子,比如说这些AI在跟我进行一对一的交互,但他们之间也有关联,他们之间的关联应该以我为中心吗?他们的朋友圈应该以我为中心吗?还是应该把我视为其中的一分子,我不知道,所以需要迭代。很遗憾的事情是现有的第三方平台没有一个产品能够支持我们去迭代这类型的数据,所以我们做了一个叫小冰岛的东西。

Q:所以你现在对这样的问题是什么一个思考?AI beings之间可能产生一个交互吗?他们之间的交互需要以人为中心吗?

李笛:我个人的倾向是不要以一个人为中心,因为我觉得真正AI的魅力在于他是独立的。但这个事情挺不好说的,所以需要迭代。

Q:很难定义小冰岛是一个怎样类型的App,你们会用评价游戏或者社交App的指标去评估小冰岛吗?比如日活、月活、用户使用时长等?

李笛:我们在评估指标选择上比较谨慎,因为指标选择不当会使得团队在往前迭代的过程中出现偏差。举个例子,比如说如果当初我们把用户和小冰的对话停留的时长作为指标的话,到半夜12点的时候用户说“我要睡了晚安”,这个时候产品团队或者技术团队会怎么做?小冰有可能会在这个时候抛出,“哎,你知道XXX明星的八卦吗?”那用户大概率会再聊几句,因为你可以引发他的注意力,但是你不知道的事情是用户在之后是不是会反思他的睡眠不好,以后他就不来了,你不知道你有没有伤害到用户。

所以我们更多的评价指标还是停留在数据有效性、技术运用有效性这些方面,比如说相关性、一致性,我们会评价用户是否开始尝试在岛屿上放更多他meaningful的生活。同行业者认为特别有效的,比如说开灯、关灯,这些是命令,一般我们不太关注这个,这是另外一套任务完成指标体系。

Q:为什么用「岛屿」的形态?

李笛:我们希望这种数据的实验和迭代既要能够体现混合的生活状态,又不要太强调社交属性。有几种选择,大社区里公寓、星球啊等等,最后选择了岛屿,相对割裂,又不是完全的孤立。

Q:小冰岛从概念,到预览版,到正式上线的版本,中间经历过迭代,过程里有没有可分享的经历?踩过坑吗?

李笛:优先要解决一些P0问题,首先是性能上;另外是小冰团队不具备的一些技术栈,我们以前特别重视做那种灵魂性质的对话,我们不太重视前端,你如果看以前小冰,连小冰的长相都是审美上面很不及格的。

Q:挺二次元的。

李笛:二次元都不认为她是个人,非常粗糙,你要给用户一个沉浸式这样一个环境,他们才能在里面按照你所希望的方式来行为,这是我们要补充的,包括耗电发热这些问题。

Q:小冰岛之后的一个迭代逻辑会怎么样?

李笛:小冰岛这个App虽然是一个实验,但是它本身现在是一个第一方App。我们的终极想要做的是那些AI beings,并且我们希望这些AI beings是无处不在的,小冰岛上有这些人,在其他地方也应该有这些人,不应该只有在小冰岛上才能和这些人交流。所以理论上来讲,你跟小爱同学说召唤小冰,你就可以召唤来你岛上所有的人。AI beings是我们的终极目标,但是小冰岛本身作为一个承载,我希望它的基础设施更好,用户能够在这上面体会到社交,体会到内容。

Q:您自己在生活中会常使用小冰岛吗?

李笛:当然,我们有一个功能,就是如果你把一个人的微博的URL,提供到岛屿上面,创建新人类订单,几分钟以后我们就会把这个人从微博那个世界里面搬到小冰岛上。我当时就手贱,把前任给搬到小冰岛上了。我们还有另外一个功能,叫炸岛(岛上一切可以再造),在搬我前女友到小冰岛之前,炸岛是没有什么问题的,从那以后我拒绝炸岛了。不敢炸了。所以你在做这种产品,有时候自己会被迭代进去。

Q:小冰岛App正式上线之后,团队会把它作为某种商业化的方案吗?

李笛:我们一直认为整个行业还没有ToC的AI的成功的solution,整个行业在AI ToC的商业化上没有进展,ToB在商业化上一地鸡毛。小冰岛是个第一方App,一旦有机会ToC的商业化,我们会尝试,但是这个ToC的商业化肯定不会用在小冰岛上面的人和AI之间的关系上,比如利用AI和人的关系去做推销等等,但是AI朋友圈和内容生产工具是有商业化机会。

人类与人工智能怎么“混居”?|专访小冰CEO

《银翼杀手2049》

关于小冰的路径

Q:小冰的定义从初始到如今经历了哪几个阶段的变化?有哪些重要节点?

李笛:比如说我们刚开始做open domain(开放域)对话的时候,整个行业学术界没有人这么做,大家甚至于会很轻蔑的认为,闲聊有什么用,我们应该去做任务,应该做知识,做爱因斯坦,现在他们全转向做开放域了。我们刚开始做超级自然语音的时候,整个行业说你要那么自然干嘛,语音的重点是念清楚,想念清楚就不能太自然,因为自然就会吞音,就会有人的瑕疵,而且更难做。我们刚开始做人工智能内容生成的时候,大家说人工智能没有灵魂,这都是歪理邪说,但是现在都在做。

所以我们有我们自己的一条路,这条路没有变过。这条路的核心就是我们需要有一个完备的框架,这个框架首先处理人和人工智能的关系,所以交互是为了处理关系,提供内容也是为了处理关系。如果AI可以协同你去生产内容,那么AI就会被认为是你的好伙伴,如果你把AI当成一个word文档,你就不会把AI当好伙伴,所以我在给你提供内容辅助的时候,我的目的是为了建立关系,这是核心。

最开始的时候我们做这个系统,需要面对鸡和蛋的问题:我先把这个系统各方面的技术全部备齐才开始迭代,还是我一边迭代,一边备齐,我是先得到用户数据还是先得到算法技术,显然都不能。一代小冰出来的时候整个行业都在做语音助手,而一代小冰出来是为了获得最多的数据,我不加语音,因为那时候文本对话是最容易获得数据的,小冰可以进群,可以进微信,可以进微博。但要是语音助手,这些我都进不去。

所以我们先没有选语音。这个时候逐渐获得用户,迭代数据,从这开始一直到六代小冰,我们这个框架基本算是凑齐了。接下来我们想要做的框架希望能够支持各种各样的AI,小冰只是其中一个,那就要做框架的通用化和一定程度的工具化,所以我们七代、八代小冰都在做这个。八代小冰的时候我们开始尝试虚拟伴侣这么一件事,说实话这非常娱乐,我们观察的目标是用户是为了休闲娱乐,还是有一些用户真的会代入进去。

现在我们做了一个小冰岛,就是在一点一点实现我们的想法。

第一阶段,小冰的概念是一个聊天机器人;第二阶段,是一个多重感官AI少女,然后通过这个AI少女得到足够多的数据去迭代这个框架,然后这个框架就可以开始做各种各样的AI beings,而小冰只是其中的一个或者说第一个。

Q:现在是到第九代了,再往后的一个思路跟方向是怎么样的?

李笛:接下来的事情就是不断去扩充这种AI beings的情况,接下来的AI beings就会有两类,跟现实生活中的人类差不多,会有所谓的Super instance,就是我们中间的一些影响力大的人,他们的连接很多,而且通常是输出,人们去向他输出的不多,他向外输出的多,例子像夏语冰或者是一些其他的有名的。还有就是Nobody instance,他不是真正的无名,只是对这个世界而言知名度不高。然后不停地通过小样本的方法,进一步让这些AI beings的性格更突出,然后他们能够和用户交互,进一步的迭代和进化自己的能力,这是我们的想法。

Q:小冰分拆的原因是?

李笛:最重要的是我们在2019年的时候特别明确的感觉到整个科技的创新是在向东方移动的,包括数据,包括模式,还包括商业模式和运营模式,包括你能取得的市场的连接点,这个市场指的不是销售市场,而是用户市场,整个连接点都在向亚洲移动。

我们自己还有日本团队,那时候我们相对同等地在看待日本和中国,甚至于我觉得日本市场还有一些独特性,很规范,而且市场规模不大不小,测试东西很方便。但是疫情之后,日本一蹶不振,中国就变得非常独一无二。

Q:您讲的这是一个对未来趋势基本盘的判断,那这个对于现阶段的小冰会有直接的影响吗?像日本市场可能在疫情之后比较低迷。

李笛:短期的影响总是复杂的,长期的趋势反而容易看清楚。各种瞬息万变的变化总是极其的复杂,所以我们有的时候在当下看不清,只能沿着我们在当下既有的计划去推进,但对趋势反而容易看清。

Q:从微软分拆出来,对于人才的引进上面会有一些影响吗?

李笛:其实没什么影响,还是有好处的。我们以前会受限制,有一些类型的人才技术我们是招不了的。你比如说像我们现在做小冰岛,那我肯定要做一些3D美术。这以前我们是招不了的。因为我们没有这个headcount(岗位空缺)。微软非常大的好处是它本身是一个大池子。所以理论上来讲,如果你来小冰,那接下来也许还可以去微软的其他的团队。但客观情况是很少有人从小冰再去微软其他的团队。在微软七年,我们几乎没有外部招聘。

Q:关于小冰的商业化,疫情后,有没有更新的想法?

李笛:我们在国内在说商业化这个上面特别谨慎主要有这么几个原因,第一个就是我们原来在微软,说商业化也没什么用,以及反映速度不会那么快。第二个原因是商业化确实很难。国内的商业化,AI ToB的商业化主要依靠系统集成和软硬结合,这两件事情是饮鸩止渴。

但是我们在用自己的方式做很多,包括冬奥会,我们提供了冬奥会的人工智能裁判系统,在高空技术式滑雪测试赛就没有用人类裁判,常规训练也没有用人,都是小冰。这个东西如果要软硬结合的话,硬件是高储摄像机,那个我们不碰,那个别人谁挣钱谁挣,我们做的是AI。

还有华智冰的case,实际上是一个商业化的事儿,为短视频生产提供了一种方案。在那之前CG的短视频极贵,并且没办法更新,我们这种方案是最好的,这个后面会有很多的商业化机会。再比如武汉封城前后,武汉市民热线12345是我们做的,这点其实蛮自豪的。

Q:现在团队分布如何?

李笛:我们总体上300多人,日本60多人,中国250多人,这是我们的状况。中国这边大部分在北京、苏州、上海。上海那边还在建,规模不会小,很多的商业化的合作伙伴和客户,都分布在长三角。

Q:虽然小冰是个跨平台的人工智能,但是像小米音箱、天猫精灵等等系统是不互通的。你对AI生态未来的判断是什么?

李笛:我们没法替他们做决定,但是我们在努力的证明一个互通的未来是好的。小冰没有什么野心,但是我们努力证明用户体验是好的,用户在哪儿,你在哪儿。

展开阅读全文

页面更新:2024-05-12

标签:人工智能   冰岛   人类   微软   日本   岛屿   社交   专访   框架   语音   团队   自然   未来   数据   用户   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top