刚刚,谷歌AI路线图曝光:竟要抛弃注意力机制?Transformer有致命缺陷

未来AI路线图曝光!谷歌发明了Transformer,但在路线图中承认:现有注意力机制无法实现「无限上下文」,这意味着下一代AI架构,必须「从头重写」。Transformer的时代,真的要终结了吗?在未来,谷歌到底有何打算?

就在最近,谷歌未来的AI路线图曝光!

谷歌产品负责人Logan Kilpatrick在AI工程师世界博览会的演讲中,介绍了Gemini模型的未来。

在未来,Gemini的全模态是重点,模型正在逐步变成智能体,推理能力还会持续扩展。

要点速览——

· 全模态(r)

已经原生支持图像 + 音频生成,接下来是视频

· Diffusion的早期实验(r)

扩散模型相关

· 默认具备Agent能力(m)

一流的工具调用与工具使用能力,但更重要的是,模型正在逐步变成智能体

·推理能力持续扩展(s)

一个又一个研究突破接踵而至

· 更多小模型(s)

很快会有更多内容可以分享

· 无限上下文(r)

以当前注意力机制和上下文处理方式,这是不可能实现的 我们需要在核心架构层面进行全新创新,才能实现这一目标

· 大模型

规模即一切

注意,(r)、(s) 和 (m) 表示每个项目在谷歌路线图中的进展程度:

(s)= short:短期/即将上线——表示已经在进行中或即将推出的项目

(m)= medium:中期——仍在开发中的项目,将在未来几个季度内推出

(r)= research:研究/长期项目——在发布之前仍处于实验阶段或需要突破性进展

硅谷大厂混战,AI年中成绩单大盘点

可以看出,谷歌现在是春风得意马蹄疾,Gemini 2.5 Pro让它稳稳扳回了一局,再次证明了自己在AI领域老大哥的地位。

X上的大V「Chubby」,也对硅谷大厂们进行了一期「年中盘点」。

OpenAI

目前仍处于领先地位,凭借o3、o3 pro以及即将到来的GPT-5,依然地位稳固。他们保持着定期更新,经常发布AI工具,不断增长的用户数量说明了一切。

DeepSeek

DeepSeek在r1取得可观成功后陆续推出了重大更新,但目前全世界仍在等待后续产品r2。关于DeepSeek后期将如何继续推进,目前尚无线索。

Anthropic

仍然是软件开发(SWE)领域的领头羊。如果其CEO所言不虚,智能体和进一步的发展将在未来几年内实现所有流程的自动化,并由通用智能体来处理。目前,Anthropic 正专注于商业领域(这一点从较低的速率限制上也不难看出),并继续保持强劲地位。

谷歌

然而,今年最大的赢家可能是谷歌,它几乎是从后起之秀跃居领先地位。Gemini 已经取得了令人瞩目成功。产品的定期更新、许多公告,包括出色的TPU定位,让谷歌的未来看起来一片光明。

Meta

不可否认,Meta已经落后了。Llama 4失败了,Behemoth也还没有发布。小扎组建了新的超级智能团队,试图再次迎头赶上。Alexandr Wang从Scale AI加入Meta是否会成为转折点?仍有待观察。

Grok

Grok 3.5也即将上线。目前很难评估。Grok在Colossus集群中显然处于有利位置。然而,它是否能训练出更好的模型?仍有待观察

这其中评价最高的谷歌,接下来一段时间会有什么大动作?

让我们仔细看看Logan Kilpatrick的演讲内容,从中找出关键线索。

全谷歌公认,Gemini 2.5 Pro是谷歌重大转折点。

这次大会上,前OpenAI成员、谷歌AI Studio产品负责人Logan Kilpatrick的演讲干货满满,透露了不少Gemini 2.5 Pro以及将来谷歌Gemini的计划的细节

关于Logan Kilpatrick这位哥,还有一件趣事:据说Gemini制作笑话的能力完全是根据他的推文训练出来的,这就是为什么它们都不好笑。

展开阅读全文

更新时间:2025-06-18

标签:科技   路线图   注意力   缺陷   机制   模型   能力   开发者   产品   上下文   未来   智能   团队   主动   工具

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top