国产AI芯片拿下近10亿融资 性能超英伟达 这会改写格局吗

国产AI芯片创企墨芯完成近10亿元C轮融资,多家头部国资、产业资本扎堆入局,年底还要发布新一代推理卡。多数分析都把这当成国产AI芯片替代的又一个标志性事件,但我看到的是另一个信号:国产AI芯片的竞争,已经从“能不能做”进入“能不能降本”的新阶段。稀疏计算这条小众路线,真的能扛起推理降本的大旗吗?

墨芯AI计算卡系列产品 / 展示S4、S10、S30、S40、S40AC五款计算卡

推理需求涨了10倍 资本押注小众路线

过去两年AI芯片圈的热钱,大部分都流向了训练芯片,大家都盯着做大参数、拼峰值算力。但市场需求结构已经悄悄变了。

据多家行业机构测算,当前国内推理算力需求已经攀升至训练算力的10~15倍。当大模型从实验室走向产业落地,推理才是真正的刚需市场,也是降本压力最集中的战场。

墨芯选择的稀疏计算,是一条和大多数玩家都不一样的路线。绝大多数国产AI芯片厂商,还是走“堆算力、拼参数”的老路,本质上是跟着国外巨头的既有路线补短板。

但稀疏计算从底层逻辑就不一样——它不是拼谁能堆出更大算力,而是想办法把冗余的计算砍掉,用同样的硬件跑出更高的实际效率。

这种思路刚好戳中了当前推理场景的痛点:现在大模型推理,90%以上的计算其实都是冗余的,如果能把这些冗余砍掉,单token成本就能直接降下来,对企业来说吸引力不言而喻。

这轮近10亿元融资到位后,墨芯把大部分资金都砸向两个方向:一是新一代SparsePrime推理卡的研发量产,二是覆盖全国多区域的算力网络布局。资本显然是看好这个方向的爆发可能性。

MLPerf三次夺冠 性能反超英伟达A100 H100

很多人对稀疏计算的疑问在于:这只是实验室里的技术,还是真能落地打实战?墨芯给出的成绩,已经超出了很多业内人的预期。

在全球权威AI测评MLPerf中,墨芯的AI加速卡已经连续三次夺冠,性能数据直接对标英伟达的旗舰产品。我们来看一组具体对比:

MLPerf算力对比柱状图 / 呈现单卡、四卡算力测试的对比数据

这样的性能反超,放在三年前几乎是没人敢想的事。更关键的是,墨芯的优势不是来自堆更多硬件,而是来自底层架构的创新。

很多玩家做稀疏计算,只是在算法层面给模型剪枝,治标不治本。墨芯是直接把稀疏计算做进了芯片的计算核里,从软硬件协同的层面实现了效率提升。

这个原理其实很好理解,就像我们的大脑处理信息,只需要激活对应区域的神经元,不需要全脑同步运转。放到AI计算上,就是给不同任务做稀疏激活,只算需要的部分,砍掉所有冗余计算。

这种底层架构的差异,带来的不仅仅是性能提升,还有实打实的成本下降。在一个制造业客户的项目中,墨芯给出的方案比市面主流方案降低了30%~50%的落地成本,刚好满足了客户对能效比的硬性要求。

墨芯OFFETT AI芯片 / 展示带有品牌标识的方形AI芯片外观

不是为了超车 是换了一条赛道

现在行业里聊国产AI芯片,总喜欢说“弯道超车”,但墨芯这条路,其实不是弯道超车,而是换道生长。

当所有人都挤在“拼绝对算力”的赛道上,稀疏计算开辟了一个新的赛场:比拼的不是你能堆多少晶体管,而是你能把算力利用率提到多高。

这个行业有一个被很多人忽略的真相:现在主流GPU的算力利用率,其实非常低——很多场景下甚至不到20%,大部分算力都被浪费在冗余计算上。用户花大价钱买了卡,却只能用出五分之一的性能,这本身就是巨大的不合理。

墨芯的差异化价值,就是解决这个不合理。把冗余计算砍掉,让每一块芯片的算力都能被充分利用,最终帮客户把推理成本打下来。

从目前的商业化进展来看,这个路径已经跑通了。墨芯已经在云端、边缘端、算力网络侧拿到了不少商业化订单,在全国多个区域完成了千卡集群部署,还形成了从S4到S40的梯度产品矩阵,能覆盖从小模型到超大规模大模型的全场景需求。

今年年底即将发布的新一代SparsePrime计算卡,更是直接瞄准了未来3-5年超大规模模型的推理需求,依托Antoum2.0架构打造,对Transformer模型做了深度适配,开发者几乎不需要修改代码就能直接迁移部署,门槛降得非常低。

降本才是国产AI芯片的真正破局点

AI产业发展到今天,已经从技术尝鲜走到了产业普及的阶段。这个阶段最大的刚需不是更高的峰值算力,而是更低的推理成本。

国家数据局的数据显示,今年3月底我国日均Token调用量突破140万亿,和2024年初相比增长超千倍。

这样爆炸式的增长,本质上就是推理需求的爆发。当调用量涨了上千倍,如果成本不跟着降下来,没有任何一家企业能扛得住这样的支出。

稀疏计算刚好踩中了这个趋势,它能在保证模型精度不变的前提下,把单token的运行成本降到比主流GPU低得多的水平,在很多特定场景优势更加明显。

这也给所有国产AI芯片厂商提了一个醒:国产替代不是简单的“别人做什么我们做什么”,找到现有路线没有解决的痛点,从底层创新重构成本结构,才是真正的破局路径。

墨芯现在已经跑通了从芯片设计到量产落地的全链条,也构建了成熟的商业化闭环,团队预期明后年就能实现盈亏平衡。这对很多还在烧钱换规模的AI芯片创企来说,本身就是一个非常值得参考的样本。

黄仁勋说过,AI推理的增长不是100倍、1000倍,而是100亿倍。面对这样量级的增长,现有技术路线肯定满足不了降本需求,一定会有新的计算范式站出来接过接力棒。

稀疏计算是不是那个最终答案还不好说,但至少我们已经看到,国产AI芯片已经不再是跟着别人屁股后面追,开始有人敢从底层定义新的规则。当更多这样的玩家冒出来,国产AI芯片的黄金时代,才真的要来了。


#AI妙生图##芯片##人工智能##IPO##资本##算力网络#

展开阅读全文

更新时间:2026-05-30

标签:科技   英伟   融资   格局   芯片   性能   稀疏   冗余   模型   成本   底层   路线   需求   场景

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top