海尔旗下雷神在北京发布了覆盖塔式、迷你、移动三类产品的AI工作站全矩阵,不仅把百B级大模型放进了桌面迷你主机,更是把1kg轻薄本做成了能跑本地AI智能体的终端。
大多数报道都在讲这是一次普通的新品发布,可我却觉得,这件事藏着端侧AI落地的一个关键转折点:原来Agent时代的算力,不一定都得堆在云端。当大模型可以跑到每个人的桌面甚至口袋里,行业的游戏规则会发生什么变化?

雷神D9000集群版迷你主机 · 四台黑色迷你主机排列展示,带接口与线缆
提起AI工作站,大部分人的第一印象还是机房里柜子一样的塔式服务器,笨重、昂贵、只服务于企业和科研机构。
但雷神这次的发布,直接把AI工作站的形态边界彻底撕开了——从顶天立地的旗舰塔式,到能放在桌面的迷你主机,再到可以随身带走的笔记本,三个形态全给配齐了。这是业内首批完成三大形态全覆盖的AI工作站产品矩阵,这本身就是一个信号:AI算力正在从机房走向桌面,走向口袋。

雷神AI Master T9000塔式工作站 · 塔式工作站内部结构与配套显示器、键鼠
作为性能旗舰的塔式工作站,这次堆料确实猛。旗舰AI Master T9000直接上了96核的AMD锐龙Threadripper PRO 9995WX处理器,搭配四块AI Pro R9700加速卡,FP8算力突破3000TFLOPS。
这个算力是什么概念?它可以流畅跑70B到130B级大模型的全参数微调与推理,还能支持7×24小时不间断科研级高负载运行,从超算级需求到学生个人入门,全线都覆盖到了。
3000TFLOPS的FP8算力,相当于过去数台中端AI服务器的总算力,现在被整合到了单台塔式工作站里。
更有意思的其实是迷你AI工作站。旗舰D9000水冷版只用一台巴掌大的主机,就能流畅跑通Qwen3.5-122B和gpt-oss-120B这样的百B级大模型;四台D9000组成集群,就能跑DeepSeek R1 671B满血版模型,推理延迟还能控制在200ms以内。

雷神AI Master M7000移动工作站 · 两台深蓝色笔记本,一台展示背面一台展示屏幕
对比传统方案,这个成本和功耗下降堪称降维打击——总拥有成本是传统GPU服务器集群的五分之一,功耗仅为十分之一。
雷神判断,AI已经正式迈入智能体时代,行业正在从单纯的文本预测转向自主逻辑思考。这个判断其实戳中了当前AI算力需求变化的核心。
当每个用户可以拥有5个、10个甚至上百个AI智能体同时运行,每个智能体都要自主完成多轮推理和任务执行,算力需求的结构和消耗模式都和之前完全不一样了。
过去云端大模型是“单模型多用户”,现在端侧智能体是“多模型单用户”,算力需求的分布逻辑完全反转了。
过去我们总觉得,AI算力就得靠云端堆卡,用户只需要一个轻量终端联网调用就行。但这个逻辑在Agent时代开始出现问题:多智能体并行推理需要大量低延迟交互,数据隐私要求越来越高,云端调用的成本和延迟瓶颈开始凸显。

雷神AI塔式工作站产品矩阵 · 四款塔式工作站的定位、配置与适用场景
雷神这次选择全栈和AMD合作,用GPU加CPU协同的算力组合,刚好踩中了这个需求变化。AMD从云端到终端的全层级芯片矩阵,给雷神提供了从旗舰超算到随身终端的完整算力支撑。
最极致的例子就是那款仅重1kg的aibook 14 Air Carbon AI智能体PC,用碳纤维+镁合金机身做到了1kg重量,却能支持AI Agent本地运行,做到数据完全不出本地。这在几年前,根本是无法想象的。
Agent时代的核心矛盾,已经从“有没有足够大的模型”变成了“能不能低成本低延迟跑多个智能体”。

雷神aibook 14 Air Carbon笔记本 · 两台白色轻薄笔记本,一台展示背面一台展示屏幕
我看到一个很容易被忽略的细节:四台D9000组成的集群就能跑DeepSeek R1 671B满血版,总拥有成本只有传统GPU集群的五分之一。
我查了一下公开资料,之前要跑DeepSeek R1满血版,至少需要两台配备多张H100的GPU服务器,前期投入成本几百万,大部分中小企业根本玩不起。现在用迷你集群就能搞定,直接把私有化大模型部署的门槛往下拉了一个大台阶。
部署方案 | DeepSeek R1 671B满血版 | 相对成本 | 相对功耗 |
传统GPU服务器集群 | 支持 | 5× | 10× |
雷神D9000四机集群 | 支持 | 1× | 1× |
这个变化带来的影响,远比我们想象的更大。对于很多有私有化部署需求的企业来说,比如政务、医疗、法律这些对数据安全要求高的行业,成本降下来意味着,以前用不起的大模型现在能用了。

雷神全系列AI工作站产品 · 塔式、迷你、移动工作站全系列产品展示
发布会现场雷神就演示了,D9000集群跑MiniMax M2.7 230B模型的实时推理,实际效能完全满足企业级需求。再加上雷神自研的ThunderAI大模型管理平台,能做到大模型一键下载、自动优化配置,进一步降低了使用门槛。
不仅如此,雷神还拉上AMD、京东云、阿里云还有多家软硬件厂商一起成立了AI产业联盟,围绕AI算力基础设施、大模型私有化部署、端侧智能体应用这些方向协同。这说明不是雷神一家在推,整个产业链都在往端侧AI落地这个方向走。
过去两年,大家都在盯着云端大模型拼参数、拼算力,谁的参数多谁就是老大。但现在看来,端侧AI的普及速度,可能会比大多数人预判的快得多。
真正的AI普及,从来不是让所有人都去调用云端的超大模型,而是让不同规模的AI能力能匹配到不同场景的用户,让每个人都能用得起适合自己的AI算力。
雷神这次把AI工作站做到三个形态全覆盖,从千元级入门的学生款到几百万级的科研级都覆盖,本质上就是在做这件事:把AI算力从少数人才能用得起的“奢侈品”,变成不同用户都能消费得起的“日用品”。

雷神AI Master D9000迷你工作站 · 两台黑色迷你主机,一台带状态显示屏
当一个学生花几千块就能买到能跑百亿级大模型本地推理的工作站,当一个中小企业几十万就能部署私有化的满血大模型,这会释放出多少创造力?这是之前云端垄断算力的时代很难实现的。
我们总说Agent时代会改变每个人的工作方式,但这个改变的前提,是算力得先跟上。当算力能下沉到桌面、下沉到口袋,成本降到大部分人都能接受,真正的Agent普及才会开始。
这场端侧AI算力的下沉,才刚刚开始。下一个跟进的玩家,恐怕会比我们预想的来得更快。
#AI妙生图##DeepSeek##芯片##处理器##内存#
更新时间:2026-05-30
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号