雷神完成三类AI工作站全覆盖端侧算力格局生变？

海尔旗下雷神在北京发布了覆盖塔式、迷你、移动三类产品的AI工作站全矩阵，不仅把百B级大模型放进了桌面迷你主机，更是把1kg轻薄本做成了能跑本地AI智能体的终端。

大多数报道都在讲这是一次普通的新品发布，可我却觉得，这件事藏着端侧AI落地的一个关键转折点：原来Agent时代的算力，不一定都得堆在云端。当大模型可以跑到每个人的桌面甚至口袋里，行业的游戏规则会发生什么变化？

雷神D9000集群版迷你主机 · 四台黑色迷你主机排列展示，带接口与线缆

业内首个全形态AI工作站矩阵打破端侧算力刻板印象

提起AI工作站，大部分人的第一印象还是机房里柜子一样的塔式服务器，笨重、昂贵、只服务于企业和科研机构。

但雷神这次的发布，直接把AI工作站的形态边界彻底撕开了——从顶天立地的旗舰塔式，到能放在桌面的迷你主机，再到可以随身带走的笔记本，三个形态全给配齐了。这是业内首批完成三大形态全覆盖的AI工作站产品矩阵，这本身就是一个信号：AI算力正在从机房走向桌面，走向口袋。

雷神AI Master T9000塔式工作站 · 塔式工作站内部结构与配套显示器、键鼠

作为性能旗舰的塔式工作站，这次堆料确实猛。旗舰AI Master T9000直接上了96核的AMD锐龙Threadripper PRO 9995WX处理器，搭配四块AI Pro R9700加速卡，FP8算力突破3000TFLOPS。

这个算力是什么概念？它可以流畅跑70B到130B级大模型的全参数微调与推理，还能支持7×24小时不间断科研级高负载运行，从超算级需求到学生个人入门，全线都覆盖到了。

3000TFLOPS的FP8算力，相当于过去数台中端AI服务器的总算力，现在被整合到了单台塔式工作站里。

更有意思的其实是迷你AI工作站。旗舰D9000水冷版只用一台巴掌大的主机，就能流畅跑通Qwen3.5-122B和gpt-oss-120B这样的百B级大模型；四台D9000组成集群，就能跑DeepSeek R1 671B满血版模型，推理延迟还能控制在200ms以内。

雷神AI Master M7000移动工作站 · 两台深蓝色笔记本，一台展示背面一台展示屏幕

对比传统方案，这个成本和功耗下降堪称降维打击——总拥有成本是传统GPU服务器集群的五分之一，功耗仅为十分之一。

Agent时代算力需求变了 CPU+GPU协同成核心关键

雷神判断，AI已经正式迈入智能体时代，行业正在从单纯的文本预测转向自主逻辑思考。这个判断其实戳中了当前AI算力需求变化的核心。

当每个用户可以拥有5个、10个甚至上百个AI智能体同时运行，每个智能体都要自主完成多轮推理和任务执行，算力需求的结构和消耗模式都和之前完全不一样了。

过去云端大模型是“单模型多用户”，现在端侧智能体是“多模型单用户”，算力需求的分布逻辑完全反转了。

过去我们总觉得，AI算力就得靠云端堆卡，用户只需要一个轻量终端联网调用就行。但这个逻辑在Agent时代开始出现问题：多智能体并行推理需要大量低延迟交互，数据隐私要求越来越高，云端调用的成本和延迟瓶颈开始凸显。

雷神AI塔式工作站产品矩阵 · 四款塔式工作站的定位、配置与适用场景

雷神这次选择全栈和AMD合作，用GPU加CPU协同的算力组合，刚好踩中了这个需求变化。AMD从云端到终端的全层级芯片矩阵，给雷神提供了从旗舰超算到随身终端的完整算力支撑。

最极致的例子就是那款仅重1kg的aibook 14 Air Carbon AI智能体PC，用碳纤维+镁合金机身做到了1kg重量，却能支持AI Agent本地运行，做到数据完全不出本地。这在几年前，根本是无法想象的。

Agent时代的核心矛盾，已经从“有没有足够大的模型”变成了“能不能低成本低延迟跑多个智能体”。

雷神aibook 14 Air Carbon笔记本 · 两台白色轻薄笔记本，一台展示背面一台展示屏幕

迷你集群击穿成本墙私有化部署门槛大幅下降

我看到一个很容易被忽略的细节：四台D9000组成的集群就能跑DeepSeek R1 671B满血版，总拥有成本只有传统GPU集群的五分之一。

我查了一下公开资料，之前要跑DeepSeek R1满血版，至少需要两台配备多张H100的GPU服务器，前期投入成本几百万，大部分中小企业根本玩不起。现在用迷你集群就能搞定，直接把私有化大模型部署的门槛往下拉了一个大台阶。

部署方案	DeepSeek R1 671B满血版	相对成本	相对功耗
传统GPU服务器集群	支持	5×	10×
雷神D9000四机集群	支持	1×	1×

这个变化带来的影响，远比我们想象的更大。对于很多有私有化部署需求的企业来说，比如政务、医疗、法律这些对数据安全要求高的行业，成本降下来意味着，以前用不起的大模型现在能用了。

雷神全系列AI工作站产品 · 塔式、迷你、移动工作站全系列产品展示

发布会现场雷神就演示了，D9000集群跑MiniMax M2.7 230B模型的实时推理，实际效能完全满足企业级需求。再加上雷神自研的ThunderAI大模型管理平台，能做到大模型一键下载、自动优化配置，进一步降低了使用门槛。

不仅如此，雷神还拉上AMD、京东云、阿里云还有多家软硬件厂商一起成立了AI产业联盟，围绕AI算力基础设施、大模型私有化部署、端侧智能体应用这些方向协同。这说明不是雷神一家在推，整个产业链都在往端侧AI落地这个方向走。

端侧AI爆发的临界点已经比我们预想的来得更快

过去两年，大家都在盯着云端大模型拼参数、拼算力，谁的参数多谁就是老大。但现在看来，端侧AI的普及速度，可能会比大多数人预判的快得多。

真正的AI普及，从来不是让所有人都去调用云端的超大模型，而是让不同规模的AI能力能匹配到不同场景的用户，让每个人都能用得起适合自己的AI算力。

雷神这次把AI工作站做到三个形态全覆盖，从千元级入门的学生款到几百万级的科研级都覆盖，本质上就是在做这件事：把AI算力从少数人才能用得起的“奢侈品”，变成不同用户都能消费得起的“日用品”。

雷神AI Master D9000迷你工作站 · 两台黑色迷你主机，一台带状态显示屏

当一个学生花几千块就能买到能跑百亿级大模型本地推理的工作站，当一个中小企业几十万就能部署私有化的满血大模型，这会释放出多少创造力？这是之前云端垄断算力的时代很难实现的。

我们总说Agent时代会改变每个人的工作方式，但这个改变的前提，是算力得先跟上。当算力能下沉到桌面、下沉到口袋，成本降到大部分人都能接受，真正的Agent普及才会开始。

这场端侧AI算力的下沉，才刚刚开始。下一个跟进的玩家，恐怕会比我们预想的来得更快。

#AI妙生图##DeepSeek##芯片##处理器##内存#

展开阅读全文

更新时间：2026-05-30

标签：数码工作站格局模型集群云端成本智能需求矩阵时代终端

1 2 3 4 5

雷神完成三类AI工作站全覆盖端侧算力格局生变？

业内首个全形态AI工作站矩阵打破端侧算力刻板印象

Agent时代算力需求变了 CPU+GPU协同成核心关键

迷你集群击穿成本墙私有化部署门槛大幅下降

端侧AI爆发的临界点已经比我们预想的来得更快

一年入账72.8亿，破产巨头“起死回生”

吃透这篇避坑！2026重庆钻戒回收行情+靠谱渠道盘点

产学联动跨境合作促美业升级！中韩时尚饰品交流会在青举办

半生悟人生，健康才是硬道理

情绪文案：深情一文不值，滥情却异常迷人

半生辗转落脚青岛，平凡打拼换来衣食无忧

十年后再见前任，你会选择原谅吗？

樱桃红的时候，我都会回来丨枕边书语

古茗再投4亿元发力咖啡品类；京东外卖首发行业最严堂食标准

成都金牛宾馆卖包子了！1.5元起吃国宾馆糕点

初夏第一支冰淇淋，来宝山打卡这家上海首店~

苏州枇杷VS无锡枇杷，谁才是江南初夏的“金果之王”？

从9.9元现磨到6元瓶装，瑞幸要切入农夫山泉主导的赛道？

春假推荐！来固阳！

湖北随州草甸子街：千年水运名埠蝶变“城市会客厅”

戴尔将AMD锐龙AI Pro 400处理器引入其商务本和移动工

美国华人吐槽：中国引以为傲的扫码支付，其实是最不智能的

「库克卸任，苹果交棒」 “供应链狂人”的黄金时代与下

济南市人工智能实训基地正式启航

封神盘点！史上最火10大网游TOP排行榜，每款都是时代标杆！

4大顶尖模型被扔进虚拟小镇求生，GPT全员饿死，Grok四天灭

小米重构安卓底层用Rust重写核心模块行业格局会改写

谷歌AI Edge Gallery爆火！手机原生离线跑大模型，断网也

90后女子手搓牡丹花造型馒头引关注：顾客多是年轻人，市场

AI时代，做小游戏还能赚到钱吗？通过这个大会我们得出了答

雷神完成三类AI工作站全覆盖 端侧算力格局生变？

业内首个全形态AI工作站矩阵 打破端侧算力刻板印象

Agent时代算力需求变了 CPU+GPU协同成核心关键

迷你集群击穿成本墙 私有化部署门槛大幅下降

端侧AI爆发的临界点 已经比我们预想的来得更快

雷神完成三类AI工作站全覆盖端侧算力格局生变？

业内首个全形态AI工作站矩阵打破端侧算力刻板印象

迷你集群击穿成本墙私有化部署门槛大幅下降

端侧AI爆发的临界点已经比我们预想的来得更快