DeepSeek V4的升级,是直接把模型规模推到万亿参数级别,性能上继续对标GPT,技术路线还完成了对国产芯片的完整适配。
对标Kimi的新模型K2.6。两个中国大模型团队,几乎在同一时间拿出万亿参数级别模型,而且都走开源路线,这件事本身就很说明问题。
过去很多人看中国AI,总喜欢盯着单个公司能不能打过OpenAI,单个模型能不能超过GPT。可现在更值得看的,已经不是某一家公司的单点突破,而是整个中国AI生态正在形成一种新的竞争方式。
DeepSeek和Kimi之间有一个细节很关键。
DeepSeek V4训练时,用到了此前由Kimi团队验证和改进过的Muon 优化器。而在去年Kimi K2发布时,Kimi团队也明确使用了DeepSeek的MLA架构。

这就是中国AI开源生态最明显的特点:大家不再把每一个技术点都当成不能碰的商业秘密,而是尽量让技术流动起来。你解决了架构问题,我解决了优化器问题,别人再把推理成本压下来,整个生态一起往前走。
这种方式放在美国闭源AI公司身上,很难想象。
OpenAI、Anthropic、Google这些公司,背后都有自己的资本、云服务、客户体系和商业闭环。OpenAI和微软深度绑定,Anthropic和谷歌关系紧密。谁都知道核心模型就是估值和收入的关键,所以关键技术不可能轻易放出来。今天你发布一个新功能,明天我强调安全性更强,后天另一家说自己的模型更适合企业客户。表面看是技术竞争,实际背后都是客户预算、资本估值和市场话语权。
OpenAI和Anthropic之间的火药味已经很明显。奥特曼公开嘲讽对手把昂贵模型卖给有钱人,Anthropic也反击说OpenAI所谓安全承诺更像商业表演。双方说的是安全、价格和价值观,真正争的是企业客户、开发者入口和资本市场对下一轮估值的信心。
这种竞争不是没有意义。美国AI公司有强算力、有资金、有顶尖人才,也有成熟商业化体系。但问题在于,闭源模式天然会带来大量重复建设。每家公司都要自己建高墙,自己训练模型,自己优化系统,自己搞生态,甚至连很多已经被验证过的技术路线,也要在内部重新跑一遍。资源消耗非常大,成本自然也很高。
中国这边的压力完全不一样。
因为高端芯片长期受到限制,算力不可能像美国公司那样随便堆。资源有限,就必须把每一份算力用到更关键的地方。能复用的架构就复用,能公开的论文就公开,能降低成本的方法就尽快扩散。看起来没那么华丽,但效率很高。
成本差距已经很直接地摆在账面上。
GPT-4的训练成本大约是7800万美元。DeepSeek V3的算力租赁成本是557.6万美元。Kimi K2 thinking的算力租赁成本甚至只有460万美元。

这几个数字放在一起,对比非常明显。美国顶级闭源模型当然很强,但它的训练成本也高得吓人。中国团队在算力受限、资金规模不占优势的情况下,把训练成本压到这个程度,还能做出接近国际一线水平的模型,这不是简单的省钱,而是技术路线被现实约束逼出了高效率。
很多人说,中国AI是被限制条件倒逼出来的。这句话有一定道理。没有那么多H100可用,没有无限预算可以烧,就只能从模型结构、优化器、训练策略、推理部署、芯片适配这些环节一点点抠效率。每省下一点成本,下一轮模型训练就多一点空间。每降低一点门槛,更多开发者和企业就能参与进来。
DeepSeek V4更关键的地方,还不只是模型本身,而是它对华为国产芯片的深度适配。
过去AI训练绕不开英伟达GPU。A100、H100、H200这些产品,长期是大模型训练的核心硬件。美国芯片出口限制不断收紧之后,中国团队想拿到最先进GPU越来越难。用老卡、用受限版本、用替代方案,都会带来性能和成本问题。
所以国产模型适配国产芯片这件事,不再是可选项,而是必须做的事。
DeepSeek V4把顶级开源模型和国产芯片结合起来,释放出的信号很明确:不能一直等别人开放供应,也不能把关键训练和推理能力都压在外部硬件上。国产模型必须能在国产芯片上稳定跑起来,效率还要不断提高。

这个结论很现实。大模型训练并不是每个阶段都必须依赖同一种最高端GPU。不同阶段对带宽、显存、通信、计算精度的要求并不完全一样。只要训练流程拆得足够细,调度策略做得足够好,中低端芯片和国产芯片就有机会在部分环节发挥作用。
这对国产芯片很重要。过去很多人总觉得,国产芯片只有全面追上英伟达才有机会。可实际上,只要某些训练阶段能替代,某些推理场景能跑通,某些企业应用能稳定部署,就已经能形成真实需求。真实需求起来了,芯片厂商才有迭代空间,软件生态才会完善,模型团队也才愿意持续适配。
DeepSeek V4的价值就在这里。它不是只给行业看一个模型分数,而是在证明一条路线:国产模型和国产芯片可以一起推进。
这也是硅谷真正焦虑的地方。
如果只是单个中国模型性能提高,美国公司还可以说自己参数更多、算力更强、产品更成熟、生态更完整。可一旦中国开源模型和国产芯片形成协同,事情就不只是模型榜单排名了,而是底层技术体系能不能独立运转的问题。
当然,中国AI还没有全面领先硅谷。DeepSeek和Kimi的估值加起来,还不到对手的1/10。论融资规模、商业收入、全球客户数量、云资源掌控能力,中国AI公司目前仍然处在追赶阶段。这一点没必要回避。
但底层模型的意义,早就不只是赚钱。
它关系到技术自主,也关系到关键时刻有没有选择权。别人愿意开放接口时,你当然可以用别人的模型。别人愿意卖芯片时,你当然可以采购先进硬件。可如果有一天供应受限、合同变化、接口调整、价格上涨,甚至服务突然中断,你有没有自己的模型、自己的芯片适配能力、自己的开发者生态,这才是关键。
OpenAI和Anthropic还在争谁更安全、谁更贵、谁更适合企业客户。中国团队这边更关心的是,怎么把模型做强,怎么把成本打下来,怎么让国产芯片跑起来,怎么让更多人能用上开源模型。
这两种竞争逻辑完全不同。
硅谷闭源阵营的优势是资源集中、商业化快、品牌强、资金厚。中国开源阵营的优势是复用速度快、成本压力低、协同效率高、技术外溢明显。美国公司更像是在各自体系里做封闭竞争,中国团队则是在开源框架下不断吸收彼此成果。
DeepSeek用Kimi验证过的themon优化器,Kimi用DeepSeek的MLA架构,这种互相借力的方式,短期看可能没有那么强的商业壁垒,但长期看,它会让整个生态的进化速度变快。
因为每一次开源,都不是只服务一家企业。一个架构被验证,所有团队都能少走弯路。一个优化器跑通,后面的模型训练就能更稳。一个低成本方案成立,更多中小团队就有机会参与大模型应用开发。一个国产芯片适配案例成功,其他模型团队也会跟进优化。
更新时间:2026-07-01
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034903号