华为算力加持,DeepSeek V4 Lite逼近美国顶流

#3月·每日幸运签#

一个只有2000亿参数的AI模型,性能快追上美国最顶流的大模型了。而且它能在华为的芯片上跑。

这不是科幻,是刚刚发生的事。

DeepSeek在2月11日悄悄上线了一个新模型,叫V4 Lite,轻量版的意思。当时没人在意,毕竟2000亿参数在今天的AI圈确实算“小个子”,主流大模型早就奔着万亿去了 。

但接下来半个月,这个模型一直在悄悄升级。2月27日,有网友测试发现它的性能越来越强。到3月2日的一次更新后,Linux Do社区的开发者HCPTangHY测完直接懵了,说在他的测试里,这已经是国模SOTA——就是国内第一梯队的意思 。


更具体的数据是,这个0302版本的分数已经逼近目前全球最顶流的闭源模型Sonnet 4.6 。一个2000亿参数的轻量版,快追上别人家的旗舰了。

这事的反常识在于,参数少不等于能力弱。

过去一年,国产大模型在对话聊天方面已经跟闭源模型差别不大,但在多模态、编程、数学这些硬核能力上一直被甩开。最近发布的GLM5、MiniMax 2.5、Qwen 3.5都有提升,但人家Anthropic、OpenAI、谷歌也没闲着,差距又拉开了 。

DeepSeek这次的路子不太一样。V4 Lite的核心突破是两个:100万token上下文窗口,和原生多模态 。

100万token什么概念?相当于能一次性处理750本中等厚度的小说,或者一个中型公司的完整代码仓库 。以前DeepSeek V3.2只有12.8万token,这次直接翻了近8倍 。

原生多模态的意思是,模型从娘胎里就能看懂图片,不是后期外挂一个视觉模块拼起来的 。这玩意的重要性在于,文图对齐的能力通常远优于拼接方案,能更精准地理解“图里在说什么”,也能更连贯地生成“符合语义的图像内容” 。

有测试者用V4 Lite生成了一个Xbox 360手柄的SVG图像代码,只用了54行,结构层次清晰,细节准确。还有个“骑自行车的鹈鹕”,42行代码,多元素场景构图自然流畅 。这两项输出在代码精简度、逻辑组织和视觉还原度上,都优于DeepSeek V3.2、Claude Opus 4.6和Gemini 3.1 。

更扎心的是,V4 Lite是在非思考模式下生成的,而对比的V3.2是开了深度思考的 。一个没动脑子的轻量版,干翻了动脑子的上一代旗舰。

但真正让行业内震动的,不是这些参数和测试数据。

路透社2月26日爆出一条消息:DeepSeek在即将发布V4之前,没有按行业惯例给英伟达和AMD提供预发布版本,而是给了华为等中国芯片厂商数周的“优先期”,让他们提前适配优化 。

行业惯例是什么?AI开发者通常会在重大模型更新前,把预览版分享给英伟达和AMD这些芯片巨头,确保软件能在主流硬件上高效运行。DeepSeek之前也一直跟英伟达技术团队密切合作 。

但这次变了。消息人士说,DeepSeek给了包括华为在内的中国芯片厂商几周时间,针对自家处理器做软件适配与性能优化 。英伟达和AMD拒绝评论,DeepSeek和华为也没回应 。

这意味着什么?

有分析说,这标志着DeepSeek在生态布局上做了新的取舍:把适配重心前移至国产计算平台,为本土芯片企业预留充分时间,开展底层指令集、算子库及推理框架层面的深度协同优化 。简单说,就是要让国产大模型能在国产芯片上跑起来,而且跑得好。


有开发者测算过,V4 Lite的百万级上下文推理成本可能低于同类产品的十分之一 。这种成本优势如果属实,将重塑AI应用生态。而华为拿到优先适配权,意味着这套成本优势可能首先在国产算力上落地。

CNBC已经发出预警:DeepSeek一旦正式发布新模型,可能触发类似V3发布时纳斯达克3%单日跌幅的市场反应 。华尔街正屏息以待。

有人在X平台上说:“我的Claude订阅3月4日就到期了,希望DeepSeek在那之前能发布他们的模型。” 还有人评论:“参数规模或许不是重点,长上下文与多模态的结合才是革命性突破。”

当然,也有冷静的声音。有开发者指出,SVG测试只是窄测试项,不能代表推理、多步骤编程等核心能力的全貌 。参数量约2000亿仍属猜测,“轻量版”意味着某处有取舍,取舍在哪里尚不明朗 。

但有一个细节值得反复琢磨:DeepSeek这次的策略调整,是把适配重心从美国芯片转向了中国芯片。在重大模型更新前不给英伟达内测资格,这在大模型行业里是第一次。

一个网友评论:“轻量版不是功能弱,是成本更低。这是个成本优化的强力产品。”

2000亿参数的模型,性能逼近美国顶流,能在华为芯片上跑,推理成本可能只有别人的十分之一。这四个事实放在一起,拼出来的图景已经不是某个公司的技术突破,而是整个国产AI产业链条的咬合。

完整版V4据说参数可能突破1万亿 ,发布时间就在这几天 。到时候会是什么动静,谁也不知道。

但至少现在,那个叫“sealion-lite”的海狮,已经悄悄下水了 。

展开阅读全文

更新时间:2026-03-05

标签:科技   华为   美国   模型   英伟   芯片   参数   成本   开发者   测试   性能

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034903号

Top