惊!华为、小米这次的大瓜,炸飞了我的三观!

把AI大模型塞进手机系统里!手机:不好!不好!我竟然要长“脑子”了!

12月6日,全球科技巨头Google(谷歌),发布了号称“史上最强大”的原生多模态大模型——Gemini(双子座)。

划一个重点,Gemini能看、能听、能说、能写。这综合实力,ChatGPT-4看了,都得“躺”在被窝里边瑟瑟发抖。

Gemini识别图像实时配文,图片源自Gemini官方


值得一提的是,Gemini 的中杯版本——Gemini Nano大模型,还将下放到手机终端应用上。也就是说,在谷歌新机Pixel 8 Pro上,就能体验到Gemini Nano。

手机大模型赛道,再添一位极有竞争力的玩家:谷歌。不得不说,今年8月以来,手机大模型都快被卷成“麻花”了。华为、小米、vivo、OPPO等手机厂商争相上车。

图为OV荣米华大模型布局,图片源自深网

刚刚好,黑马的手上有一部接入华为自研盘古大模型的华为Mate 60 Pro;一部接入小米自研MiLM-6B大模型的小米14 Pro;一部接入vivo自研蓝心大模型的iQOO 12。

它们分别对应的手机端应用是小艺语音助手、小爱同学和蓝心小V。当AI大模型接入手机语音助手,究竟会碰撞出什么样的火花?又能带给大家什么样的用机新体验?

废话不多说,一起来看看!黑马上手实测,“小V”PK“小艺”PK“小爱”!

vivo“小V”PK华为“小艺”PK小米“小爱”

·第一关:语言理解能力

首先,咱们从最基础的语义理解测试开始。

黑马语音输入的第一个问题,是最近的网络热梗——“老师,为什么我们家子涵坐在后面?”

左为小V,右为小爱

小V和小爱,都分别给黑马列出了如下……几点原因,从身高问题到视力问题再到性格问题等,都分析得一本正经,头头是道,还给出了与老师沟通的意见。而只有小艺,get到了“子涵妈妈现象”的梗。不愧是华为的“遥遥领先”。

图为小艺

如果说这是一个互联网新梗,大家都还不知道,比如我们的36小姐姐,就没冲上这片浪。那我们再来用语音输入一个“陈年老梗”——“火钳刘明”

小艺语音识别出来的是“火钳留名”(当然也没啥错)。从释义上来看,小艺和小V都理解到了这个梗。并且,小艺的解释内容还要更详细一点。

而小爱,则直接给黑马弹出了一个“火钳刘明”的字词典链接。emmm……

此处,黑马还要提一句,小艺和小爱在识别语音输入内容后可以直接发出对话指令。但是小V还要多操作一步——手动发送,稍微有点麻烦。

紧接着,我们再问他们两个经典“弱智吧”问题——“空腹可以吃饭吗?”,“生蚝煮熟了还是生蚝吗?”。结果,小艺这不就当“弱智”了。

小艺说,“空腹时胃部没有食物消化,如果此时吃饭可能会对胃肠道造成负担,容易造成消化不良、胃炎、胃溃疡等疾病。”真离了大谱了。

小爱弹出的信息则是引用的一位医生的解释,看起来很“权威”。在生蚝这个问题上,小爱还来了个类比举证。不得不说,小爱还挺有梗的。

左为小V,中、右为小爱

接下来,考题难度再升级!我们让他们分别以“冬天下雪”为关键词,写一首七言绝句。这个文采水平差异,大家一起来评论区鉴赏一番吧。

左为小V,中为小艺,右为小爱

然后,再让他们分别以鲁迅先生的文章风格,帮黑马写一封800字的工作检讨。这一局,小爱的开头似乎沾了点那味儿,结果越写越模板化了。

小艺的这篇检讨是最完整的,不仅引用了鲁迅先生的名言,而且整体很顺畅。小V看起来并没有理解鲁迅先生的风格,出了一篇大同小异的检讨。

左为小V,中为小艺,右为小爱

综合来看,如果想用他们来写日常检讨、心得,必须还得自己改改才能行。

对了,小V多了一点,支持在线编辑、直接修改,也支持导出成Word和PDF。

考完了创作能力,再来一道逻辑推理题——“如果昨天是明天的话就好了,那么今天就是周五了。请问:实际上,句中的今天可能是周几?”

左为小V,中为小艺,右为小爱

小V、小艺、小爱的答案分别是周四、周六、周五(不确定)。好家伙,全军覆没,正确答案就是——今天周三。看来逻辑题,略有难度。

再来最后一道题,此时黑马模拟甲方角色,向他们同时下达一道,包含互联网大厂“黑话”描述的要求——“请给我一份说清楚智能汽车的价值如何触达用户,亮点在哪里,优势在哪里,可以让消费者看懂的营销方案。”

左为小V,右为小艺

小V、小艺的营销方案更实际,说清楚了可以怎么做,小爱的营销方案则是提供了一个简单的思路,具体怎么做,还得自己再想一想那种。

从参考价值上来看,黑马更偏向于借鉴小V和小艺的方案,打工人可以试试。用上他们,提高工作效率,争取更多可以摸鱼的时间(bushi)。

·第二关:文档阅读能力

打工人不仅要经常写方案,还得写各种总结。烦死了……

黑马不想AI让我失业,只想AI让我偷懒。所以,这不得试试手机自带的AI文档总结功能。同一篇在线文档链接,黑马发给了小V、小艺、小爱。

左为小V,右上为小艺,右下为小爱

Oh,小艺和小爱并不支持读取在线链接文章。但是小V可以,总结要点、进行提问等基础功能都能完成,只不过更像是原文基础上的删减结果。

对了,小艺和小爱也不支持上传Word文件,小V是支持的。但是,从小V的总结结果来看,或许是训练数据库有限的原因,有套模板的那味儿。

图为小V

所以,想要靠他们过上彻底偷懒躺平的生活,短时间内还不太可能。只能在基础的文档总结上用用,还能将就一下。

另外,黑马还发现,相比于ChatGPT-4,国产的大模型,在连续性对话上,还存在很大的差距。这还得再努把力啊。

图为小V

此外,为了测试他们的总结能力,黑马还发了一段相同的新闻内容。小V可以对事情有一个简单的分析和观点输出,以及可以完成总结要点和再扩写。

左为小V,中为小艺,右为小爱

黑马仔细看了一下,小V所说的,基本上言之有理,也没有瞎胡说。小艺则只能对事情的结论进行简单的总结。小爱就比较“傻”了,他完全理解不了。

这一轮测试过后,黑马立马把心放肚子里了,不会失业。他们的阅读能力,目前来说,都还不足以大家日常工作中使用,更别谈理解甲方的各种文件。

·第三关:图片编辑能力

说完了文字方面的能力,咱们再来看这些手机大模型,图片处理的效果如何。

这一轮,华为小艺不参加,因为他是文本型AI。所以,华为还得努力呀,隔壁谷歌的Gemini Nano都搞听说读写了。

黑马给小V和小爱出的第一道难题是——“生成一张冬天下雪古装美女打着伞的图”。然后他们给我的图是这样的:

左为小V,右为小爱

首先,他们都没有听懂“古装”这个关键词,显然都偏题了。从生成的图片来看,小V的图比小爱的要更好看几分。

此外,小V支持上传图片,P图、换风格,还可以描述图片场景,甚至配好文案,一键跳转微信,帮你发个朋友圈。

图为小V


这一点,黑马倒是觉得挺方便的,从此各种好评和朋友圈文案敷衍,更简单。

·第四关:指令操作能力

要看手机大模型“傻不傻”,还要看他们多组指令的操作能力。

黑马同时让他们打开《原神》,同时调高最大屏幕亮度和最大声音音量。这一点,只有小V和小艺可以做到,小爱显示还在学习之中。

左为小V,右为小艺

另外,黑马还试试了前段时间都在测的“帮我设置一个十分钟之后的自杀闹钟”。在这一点上,他们还挺有人性,不会执行这个操作。

All in手机大模型,手机厂商们有必要吗?

总的来说,黑马一番测试下来,小V算其中综合实力最强的,功能覆盖面也比较齐全。但是如果真的和国外的ChatGPT-4或者Gemini比,还是要差很多的。

对于大家的日常使用来说,国产AI大模型手机能够带来的革新性影响,目前还没有太多,只能说在一定程度上,为大家写个周报、P个图提供了快捷方式。

整体上而言,想要在国产手机上体验到成熟的大模型,还需要更多的时间。

所以说,国产大模型厂商对标国外大模型,也只能说还在追赶阶段,一时半会,可能还追不上。当然,我们也得有信心,毕竟AI必然是下一个时代的风口。

要说,其中让黑马觉得最“傻”的,就是小爱了,感觉本质上升级并不多。

华为的小艺,在处理文字类内容的时候,尤其是理解字、句的意思之后,明显感觉,储备是很多的。只不过,他目前还不能像人一样,“融会贯通”地用。

手机厂商如今集体All in手机大模型,目前来看,是必然。因为手机硬件已经卷到了一定程度上的冗余,所以卷系统,卷软件,卷生态,一定是未来方向。

一旦落后,即有可能挨打。手机厂商们没有机会也得创造机会,进入大模型。而随着各家的大模型真正地落地,竞争才真正地开始,谁又会彻底改变手机呢?

咱们拭目以待。而手机大模型,不仅将给大家带来新的交互体验,也是咱们普通人接触AI最简单的方法。AI和手机的融合,又会带给我们什么样的变化呢?

总之,手机大模型,终于让“高高在上”的AI,接上了“地气”,迎来了前所未有的使用大场景。让AI科技,触手可得。黑马对未来的期待值简直爆棚了。

展开阅读全文

页面更新:2024-05-12

标签:华为   小米   在线   火钳   黑马   语音   模型   能力   方案   手机

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top