
财经摆渡人
精研出品
破浪前行,共探财富新局
大家好欢迎收看【古今财鉴】
谷歌DeepMind刚推出的SIMA2,可能是游戏党等了多年的“神仙队友”。
它不搞游戏底层指令操控那套,纯靠看屏幕画面、用虚拟键盘鼠标操作,完完全全像人一样打游戏。
之前玩DOTA2、王者荣耀时,谁没被坑队友气到想卸载?SIMA2的出现,说不定真能解决这个老大难问题。

SIMA这名字看着复杂,全称是可扩展指令多世界智能体。
简单说,它就是个能在各种虚拟世界里,听懂指令还能自己琢磨事儿的智能体。
谷歌在AI领域的布局一直挺全面,从当年下围棋的AlphaGo,到破解蛋白质结构的AlphaFold,再到如今的Gemini大模型、Genie3世界模型,每一步都没落下。
个人觉得,SIMA2更像是这些技术积累的“集大成者”,不是凭空冒出来的产物。

之前的SIMA1已经能执行600多种语言指令,比如拍梯子、打开地图这类基础操作。
但SIMA2直接升级了,把Gemini大模型当核心引擎,不光能听指令,还会自己推理。
之前的游戏AI顶多算“工具人”,SIMA2才有点“伙伴”那味儿。
在MineDojo这款它从没接触过的游戏里,SIMA2靠着推理就能完成任务。

DeepMind用人类演示视频、语言标签和Gemini生成的标签混合训练它,这思路和特斯拉FSD的端到端技术有点像。
本来想吐槽AI玩游戏肯定不如人,结果看了测试视频,发现自己想多了它不仅能响应提问,还能琢磨自己的行为和所处环境。
研究人员说和它互动像跟伙伴合作,这事儿其实挺颠覆的,相当于在游戏场景里过了一把“图灵测试”。

谷歌选游戏当训练场,可不是单纯为了讨好玩家。
虚拟3D环境复杂多变,还不用担现实风险,刚好适合练智能体的“通用能力”。
SIMA2的泛化能力是真出众,短期指令比如左转、爬梯子早就不在话下,现在还能打通完整游戏关卡。
更厉害的是,它能跨游戏用技能,A游戏里学会的挖掘,到B游戏里就能用来采集。

除了语言指令,它还能懂多模态提示。
你在画面画个路线草图,或者发个“+树木”的表情符号,它都能get到意思,屁颠颠去砍树。
配合Genie3生成的全新3D世界,它也能快速适应,毕竟这些世界虽然看着陌生,但物理规律是一致的。
最让人惊喜的是它的自我提升能力。
一开始跟着人类示范学,后来就能自主游戏继续进化,不用额外的人类数据。
初代没完成的任务,迭代几轮后就能搞定,全程没人干预。

这种自进化能力,才是通用AI该有的样子。
但它也不是完美的。
搞不清的是,明明技术已经这么强,为啥处理超长超复杂任务还会吃力?后来发现,这其实是整个行业的难题。
它的上下文记忆不长,精细操作和复杂3D场景理解也还有提升空间。
如此看来,SIMA2现在还只是研究阶段,离真正的通用具身智能还有距离。

不过换个角度想,谷歌这步棋走得挺妙。
通过大量虚拟世界数据,加上Gemini的推理能力,把分散的专用AI能力整合到一起。
这些在游戏里习得的导航、用工具、协作技能,将来都能用到机器人身上,让它们在现实里成为真正的智能助手。
对游戏党来说,SIMA2可能意味着以后组队能选AI队友,不用再怕遇到摆烂的。

对AI行业来说,它是朝着通用智能迈出的重要一步。
毫无疑问,SIMA2的出现,让我们看到了AI和人类协同的更多可能。
或许用不了多久,不光是游戏,生活里也会出现越来越多“像人一样”的AI伙伴。
更新时间:2025-11-25
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号