四大科技巨头联手造AI神话,谷歌砸2000亿建算力,基建才是底牌

训练一个顶级AI大模型,耗电量能跟一座中型城市的全年用电量相比。谷歌2026年的AI基建支出目标接近2000亿美元,微软、Meta也在同一个量级规划数据中心扩张。

这不是在买软件,是在建一套新的物理世界基础设施。

但有一件事几乎没有人在正面回答:把这么多钱砸进去,下一代模型的能力门槛到底在哪里?持续堆算力这条路还走不走得通?在芯片、电力、散热这三道物理关卡面前,这场AI军备竞赛的真实胜算,到底掌握在谁手里?

训练下一代旗舰模型,算力需求还要再上一个数量级

大模型训练的核心操作,是让数以万计的专用芯片同时跑矩阵乘法,持续跑几个月。每一块GPU每秒执行数百万亿次浮点运算,每次运算消耗电力、产生热量。GPT-4这个量级的模型,单次训练消耗超过10²⁴次浮点运算,折算成电力,相当于数万户普通家庭的全年用量。

而业界目前讨论的下一代旗舰模型,算力需求普遍认为要在现有基础上再扩大十倍。

十倍,不是增长百分之十,是数量级的跃升。

这不是优化代码能解决的问题。更多参数需要更多计算,更多计算需要更多芯片,更多芯片需要更多电力——这是物理规律在起作用,跟算法水平无关。

还有一个经常被忽略的细节:现代大型训练集群的散热系统,成本有时候能接近芯片本身。一个十万张GPU量级的集群满负荷运行时产生的热量,需要工业级液冷系统才能带走。这些设施的建设周期以年计算,不是拍板采购芯片就能立刻开跑训练。

所以谷歌接近2000亿美元的年度AI基建预算,真实含义不是"买很多显卡",而是在建一套新的物理基础设施——规模上接近建电网、建港口的工程量级。

规模化定律在收窄,下一代竞赛同时在两条线上打

过去五年,AI领域有一条被反复验证的规律:参数量扩十倍、数据扩十倍、算力扩十倍,模型能力就会出现质变式跃升。这套规模化定律是整轮AI大爆发的底层逻辑。

但从2024年底开始,业界开始严肃讨论:这条规律还管不管用?

从GPT-3到GPT-4,能力提升是肉眼可见的量级差异。之后的模型,在很多基准测试上的进步幅度在收窄。用同样的投入再堆十倍算力,换来的能力提升是否还有同等回报?

这个问题的答案目前没有定论,但它已经逼着头部AI公司开始走另一条路:不只是在训练阶段堆算力,同时在推理阶段让模型"想更长时间"。

OpenAI的o系列模型,以及随后各家跟进的思考模型,核心逻辑就是这个:与其把所有钱砸进训练更大的基础模型,不如让同一个模型在回答问题前,先跑一套自我推导和验证的流程。

举个实在例子:同样一道复杂推理题,普通模型直接输出答案,思考模型会先推一遍、发现问题、再推一遍,在输出之前跑完完整的验证链路。消耗的是推理阶段的算力,而非训练阶段的算力。

但这条路并不是在替代超大规模训练投入。恰恰相反,要训练出能进行有效长链推理的基础模型,对训练数据质量和规模的要求更高。

我的判断是:下一代AI竞赛同时在两条战线开打——训练更强的基础模型,以及让现有模型在推理时更聪明。两件事都吃算力,方向不同,要求不同。谁能在两条线上同步跟进,谁才真正有座位。

芯片是脖子,电力是地基,供应链决定谁能留在牌桌上

另外还有一点,让这场基础设施竞赛变得格外复杂的,是整条供应链的制约结构。

训练大模型的核心芯片,绝大部分依赖台积电先进制程代工。NVIDIA高端GPU、谷歌自研TPU、各家定制芯片,全部要走同一条产线。这条产线的产能是有限的物理约束,不是市场定价能直接调节的问题。

各家公司的AI基建规划,表面上在抢芯片数量,实质上抢的是台积电的产能排期,普遍需要提前12到18个月下订单。

这里要注意一个结构性的风险:有足够的钱,但供应链卡住,钱也换不来更多芯片。这是为什么头部公司同步加大自研芯片投入——谷歌的TPU已经迭代到第七代,Meta和亚马逊也在推进自研路线。战略价值不是完全取代NVIDIA,而是在特定工作负载上降成本,同时在供应链上多一条安全通道。

电力这道关卡同样无法绕开。一个十万GPU量级的训练集群满负荷运行,需要几百到超过一千兆瓦的持续电力供应。美国很多地区的电网是按几十年前的工业用电标准设计的,承载不了这种量级的新增负荷。

所以你会看到科技巨头开始直接下场投资核电站——微软重启三英里岛核电站,谷歌和亚马逊都签署了新建小型核反应堆的协议。这不是做慈善,是因为传统电网跟不上需求增速。

从客观技术指标来看中国这条路径:算力基建的大规模投入在推进,但受高端GPU出口管制影响,可获取的顶级训练芯片在数量和代际上受到约束。应对路径是加速自研:华为昇腾系列等国产芯片与顶级NVIDIA产品仍有差距,但整条国产芯片生态链在快速建立中。差距在收窄,但还没消失,这是实情。

另一个经常被外部忽视的点是:国内电力基础设施的完整度和电网承载能力,在支撑大规模算力建设上反而有结构性优势。电力这道关卡,是美国目前面临的最真实的工程瓶颈,而这恰好是国内基建体系相对扎实的地方。

这场竞赛的终点没人能确定,但谁在浇地基谁才还在桌上

学界和工业界对"持续堆算力能走到哪里"这个问题,目前有明显分歧。乐观派认为规模化路线还有至少两到三个数量级的空间,继续推进会出现我们现在无法预见的能力涌现。悲观派认为在架构没有突破的情况下,纯堆算力已在接近收益递减区间,下一个量级的能力跳跃需要新的训练方法或模型架构。

两派都有认真的技术论据,两派也都有可能是错的。这是目前最诚实的表述。

可以确定的是:接下来三到五年,AI基础设施的建设速度会是人类工业史上最密集的基建浪潮之一。芯片产线、数据中心、电力配套、散热系统、高速互联网络,会在全球范围内同步扩张。

谁会先建成下一代超大规模训练集群,谁会因为电力或芯片供应卡住被迫踩刹车,谁手里的自研芯片能真正扛起工作负载——这些问题的答案,在未来几年会逐一浮出水面。

训练一次次世代旗舰模型要烧掉一座城市的电,这个事实本身已经告诉了我们这场竞赛的性质:它不是软件比赛,是工程和资源的角力。

在这场角力里,谁在物理世界里握着更稳的地基——电力、芯片、供应链——才真正握着这场竞赛的底牌。

这场竞赛的终点在哪里,今天没有人敢打包票。但在那个终点到来之前,持续往地基里浇混凝土的人,至少还在牌桌上。

停止浇混凝土的那一天,就是离场的那一天。

参考资料

新华社,《Google owner Alphabet to increase AI capital expenditure to record levels in 2026》

人民网,《Global AI infrastructure race intensifies as tech giants plan unprecedented data center expansion》

环球网,《Next-generation AI model training requirements push power and compute demands to new thresholds》

央视新闻,《AI infrastructure spending boom reshapes global energy and chip supply chain dynamics》

展开阅读全文

更新时间:2026-06-05

标签:科技   底牌   基建   巨头   神话   模型   芯片   电力   能力   更多   物理   基础设施   电网   数量级

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034903号

Top