OpenAI深陷硅谷内斗，DeepSeek的这个优势他学不来

DeepSeek V4的升级，是直接把模型规模推到万亿参数级别，性能上继续对标GPT，技术路线还完成了对国产芯片的完整适配。

对标Kimi的新模型K2.6。两个中国大模型团队，几乎在同一时间拿出万亿参数级别模型，而且都走开源路线，这件事本身就很说明问题。

过去很多人看中国AI，总喜欢盯着单个公司能不能打过OpenAI，单个模型能不能超过GPT。可现在更值得看的，已经不是某一家公司的单点突破，而是整个中国AI生态正在形成一种新的竞争方式。

DeepSeek和Kimi之间有一个细节很关键。

DeepSeek V4训练时，用到了此前由Kimi团队验证和改进过的Muon 优化器。而在去年Kimi K2发布时，Kimi团队也明确使用了DeepSeek的MLA架构。

这就是中国AI开源生态最明显的特点：大家不再把每一个技术点都当成不能碰的商业秘密，而是尽量让技术流动起来。你解决了架构问题，我解决了优化器问题，别人再把推理成本压下来，整个生态一起往前走。

这种方式放在美国闭源AI公司身上，很难想象。

OpenAI、Anthropic、Google这些公司，背后都有自己的资本、云服务、客户体系和商业闭环。OpenAI和微软深度绑定，Anthropic和谷歌关系紧密。谁都知道核心模型就是估值和收入的关键，所以关键技术不可能轻易放出来。今天你发布一个新功能，明天我强调安全性更强，后天另一家说自己的模型更适合企业客户。表面看是技术竞争，实际背后都是客户预算、资本估值和市场话语权。

OpenAI和Anthropic之间的火药味已经很明显。奥特曼公开嘲讽对手把昂贵模型卖给有钱人，Anthropic也反击说OpenAI所谓安全承诺更像商业表演。双方说的是安全、价格和价值观，真正争的是企业客户、开发者入口和资本市场对下一轮估值的信心。

这种竞争不是没有意义。美国AI公司有强算力、有资金、有顶尖人才，也有成熟商业化体系。但问题在于，闭源模式天然会带来大量重复建设。每家公司都要自己建高墙，自己训练模型，自己优化系统，自己搞生态，甚至连很多已经被验证过的技术路线，也要在内部重新跑一遍。资源消耗非常大，成本自然也很高。

中国这边的压力完全不一样。

因为高端芯片长期受到限制，算力不可能像美国公司那样随便堆。资源有限，就必须把每一份算力用到更关键的地方。能复用的架构就复用，能公开的论文就公开，能降低成本的方法就尽快扩散。看起来没那么华丽，但效率很高。

成本差距已经很直接地摆在账面上。

GPT-4的训练成本大约是7800万美元。DeepSeek V3的算力租赁成本是557.6万美元。Kimi K2 thinking的算力租赁成本甚至只有460万美元。

这几个数字放在一起，对比非常明显。美国顶级闭源模型当然很强，但它的训练成本也高得吓人。中国团队在算力受限、资金规模不占优势的情况下，把训练成本压到这个程度，还能做出接近国际一线水平的模型，这不是简单的省钱，而是技术路线被现实约束逼出了高效率。

很多人说，中国AI是被限制条件倒逼出来的。这句话有一定道理。没有那么多H100可用，没有无限预算可以烧，就只能从模型结构、优化器、训练策略、推理部署、芯片适配这些环节一点点抠效率。每省下一点成本，下一轮模型训练就多一点空间。每降低一点门槛，更多开发者和企业就能参与进来。

DeepSeek V4更关键的地方，还不只是模型本身，而是它对华为国产芯片的深度适配。

过去AI训练绕不开英伟达GPU。A100、H100、H200这些产品，长期是大模型训练的核心硬件。美国芯片出口限制不断收紧之后，中国团队想拿到最先进GPU越来越难。用老卡、用受限版本、用替代方案，都会带来性能和成本问题。

所以国产模型适配国产芯片这件事，不再是可选项，而是必须做的事。

DeepSeek V4把顶级开源模型和国产芯片结合起来，释放出的信号很明确：不能一直等别人开放供应，也不能把关键训练和推理能力都压在外部硬件上。国产模型必须能在国产芯片上稳定跑起来，效率还要不断提高。

这个结论很现实。大模型训练并不是每个阶段都必须依赖同一种最高端GPU。不同阶段对带宽、显存、通信、计算精度的要求并不完全一样。只要训练流程拆得足够细，调度策略做得足够好，中低端芯片和国产芯片就有机会在部分环节发挥作用。

这对国产芯片很重要。过去很多人总觉得，国产芯片只有全面追上英伟达才有机会。可实际上，只要某些训练阶段能替代，某些推理场景能跑通，某些企业应用能稳定部署，就已经能形成真实需求。真实需求起来了，芯片厂商才有迭代空间，软件生态才会完善，模型团队也才愿意持续适配。

DeepSeek V4的价值就在这里。它不是只给行业看一个模型分数，而是在证明一条路线：国产模型和国产芯片可以一起推进。

这也是硅谷真正焦虑的地方。

如果只是单个中国模型性能提高，美国公司还可以说自己参数更多、算力更强、产品更成熟、生态更完整。可一旦中国开源模型和国产芯片形成协同，事情就不只是模型榜单排名了，而是底层技术体系能不能独立运转的问题。

当然，中国AI还没有全面领先硅谷。DeepSeek和Kimi的估值加起来，还不到对手的1/10。论融资规模、商业收入、全球客户数量、云资源掌控能力，中国AI公司目前仍然处在追赶阶段。这一点没必要回避。

但底层模型的意义，早就不只是赚钱。

它关系到技术自主，也关系到关键时刻有没有选择权。别人愿意开放接口时，你当然可以用别人的模型。别人愿意卖芯片时，你当然可以采购先进硬件。可如果有一天供应受限、合同变化、接口调整、价格上涨，甚至服务突然中断，你有没有自己的模型、自己的芯片适配能力、自己的开发者生态，这才是关键。

OpenAI和Anthropic还在争谁更安全、谁更贵、谁更适合企业客户。中国团队这边更关心的是，怎么把模型做强，怎么把成本打下来，怎么让国产芯片跑起来，怎么让更多人能用上开源模型。

这两种竞争逻辑完全不同。

硅谷闭源阵营的优势是资源集中、商业化快、品牌强、资金厚。中国开源阵营的优势是复用速度快、成本压力低、协同效率高、技术外溢明显。美国公司更像是在各自体系里做封闭竞争，中国团队则是在开源框架下不断吸收彼此成果。

DeepSeek用Kimi验证过的themon优化器，Kimi用DeepSeek的MLA架构，这种互相借力的方式，短期看可能没有那么强的商业壁垒，但长期看，它会让整个生态的进化速度变快。

因为每一次开源，都不是只服务一家企业。一个架构被验证，所有团队都能少走弯路。一个优化器跑通，后面的模型训练就能更稳。一个低成本方案成立，更多中小团队就有机会参与大模型应用开发。一个国产芯片适配案例成功，其他模型团队也会跟进优化。

展开阅读全文

更新时间：2026-07-01

标签：科技硅谷优势模型芯片中国成本团队美国生态公司技术关键

1 2 3 4 5

OpenAI深陷硅谷内斗，DeepSeek的这个优势他学不来

马斯克解散xAI并入SpaceX！未来很难熬，人类离AGI只剩1095天

AI时代，对于普通人来说，要么回归原始，要么机械飞升?

中美卫星大斗法：为什么美卫星拍福建舰一清二楚，中国的很模糊？

印度塔塔泄露630GB文件！iPhone18机密曝光，苹果保密神话被打破

“学AI，懂健康”南京工业大学银龄学习中心公益讲堂

广州一重点排污单位长期人工稀释污水样本篡改监测数据，被罚45万元

6月29日尾盘40分钟：主力资金流入这些名单！

晚餐：多地密集公示钢铁产能置换方案，全球铁矿石发运量减少

无量拉高全部都是套路，A股这个熟悉的剧本，散户千万别再追高了

2026年芜湖市区计划供应经营性用地1592亩

黄金要重估到15000美元？别急，有人先把真相说透了

凝聚慈善合力共促民生发展——三明市慈善总会“走进会员单位领略会员风采”第三次主题活动侧记

兴业银行大幅上调黄金延期保证金！多家银行集体取消“个人杠杆炒金”？

“美豫粮油”亮相第九届中国—亚欧博览会 43家豫企拓展亚欧市场

孙世格：做实“党建链动”，以实干实绩推动工业经济提质增效

中美卫星大斗法：为什么美卫星拍福建舰一清二楚，中国的很

“美豫粮油”亮相第九届中国—亚欧博览会 43家豫企拓

新赛季开启第1天，这4件事情请务必要做，每个都关键，有的还

国乒出征美国大满贯赛，刘国梁担心的事情发生了，王励勤迎

全球玩家操控乌无人机？技术硬伤明显，实为精心策划的认知

中国断供日本部分稀土！日本用16年“去中国化”，结果还被

签证暴涨针对中国游客？高市不听岸田劝告，中方对日本改了

联想ISC2026发警告，中国消费者要留意，内存高价成常态？

全家沉浸式演绎：中国式家庭的日常BGM

四连败！中国男排1-3不敌世界第九德国，第四局遭10分逆转