国产AI芯片拿下近10亿融资性能超英伟达这会改写格局吗

国产AI芯片创企墨芯完成近10亿元C轮融资，多家头部国资、产业资本扎堆入局，年底还要发布新一代推理卡。多数分析都把这当成国产AI芯片替代的又一个标志性事件，但我看到的是另一个信号：国产AI芯片的竞争，已经从“能不能做”进入“能不能降本”的新阶段。稀疏计算这条小众路线，真的能扛起推理降本的大旗吗？

墨芯AI计算卡系列产品 / 展示S4、S10、S30、S40、S40AC五款计算卡

推理需求涨了10倍资本押注小众路线

过去两年AI芯片圈的热钱，大部分都流向了训练芯片，大家都盯着做大参数、拼峰值算力。但市场需求结构已经悄悄变了。

据多家行业机构测算，当前国内推理算力需求已经攀升至训练算力的10～15倍。当大模型从实验室走向产业落地，推理才是真正的刚需市场，也是降本压力最集中的战场。

墨芯选择的稀疏计算，是一条和大多数玩家都不一样的路线。绝大多数国产AI芯片厂商，还是走“堆算力、拼参数”的老路，本质上是跟着国外巨头的既有路线补短板。

但稀疏计算从底层逻辑就不一样——它不是拼谁能堆出更大算力，而是想办法把冗余的计算砍掉，用同样的硬件跑出更高的实际效率。

这种思路刚好戳中了当前推理场景的痛点：现在大模型推理，90%以上的计算其实都是冗余的，如果能把这些冗余砍掉，单token成本就能直接降下来，对企业来说吸引力不言而喻。

这轮近10亿元融资到位后，墨芯把大部分资金都砸向两个方向：一是新一代SparsePrime推理卡的研发量产，二是覆盖全国多区域的算力网络布局。资本显然是看好这个方向的爆发可能性。

MLPerf三次夺冠性能反超英伟达A100 H100

很多人对稀疏计算的疑问在于：这只是实验室里的技术，还是真能落地打实战？墨芯给出的成绩，已经超出了很多业内人的预期。

在全球权威AI测评MLPerf中，墨芯的AI加速卡已经连续三次夺冠，性能数据直接对标英伟达的旗舰产品。我们来看一组具体对比：

MLPerf算力对比柱状图 / 呈现单卡、四卡算力测试的对比数据

S40单卡特定场景峰值吞吐量，是A100的2.9倍，H100的1.4倍
4卡S30集群的算力，比4卡H100高出1.8倍，甚至超过了8卡A100集群

这样的性能反超，放在三年前几乎是没人敢想的事。更关键的是，墨芯的优势不是来自堆更多硬件，而是来自底层架构的创新。

很多玩家做稀疏计算，只是在算法层面给模型剪枝，治标不治本。墨芯是直接把稀疏计算做进了芯片的计算核里，从软硬件协同的层面实现了效率提升。

这个原理其实很好理解，就像我们的大脑处理信息，只需要激活对应区域的神经元，不需要全脑同步运转。放到AI计算上，就是给不同任务做稀疏激活，只算需要的部分，砍掉所有冗余计算。

这种底层架构的差异，带来的不仅仅是性能提升，还有实打实的成本下降。在一个制造业客户的项目中，墨芯给出的方案比市面主流方案降低了30%～50%的落地成本，刚好满足了客户对能效比的硬性要求。

墨芯OFFETT AI芯片 / 展示带有品牌标识的方形AI芯片外观

不是为了超车是换了一条赛道

现在行业里聊国产AI芯片，总喜欢说“弯道超车”，但墨芯这条路，其实不是弯道超车，而是换道生长。

当所有人都挤在“拼绝对算力”的赛道上，稀疏计算开辟了一个新的赛场：比拼的不是你能堆多少晶体管，而是你能把算力利用率提到多高。

这个行业有一个被很多人忽略的真相：现在主流GPU的算力利用率，其实非常低——很多场景下甚至不到20%，大部分算力都被浪费在冗余计算上。用户花大价钱买了卡，却只能用出五分之一的性能，这本身就是巨大的不合理。

墨芯的差异化价值，就是解决这个不合理。把冗余计算砍掉，让每一块芯片的算力都能被充分利用，最终帮客户把推理成本打下来。

从目前的商业化进展来看，这个路径已经跑通了。墨芯已经在云端、边缘端、算力网络侧拿到了不少商业化订单，在全国多个区域完成了千卡集群部署，还形成了从S4到S40的梯度产品矩阵，能覆盖从小模型到超大规模大模型的全场景需求。

今年年底即将发布的新一代SparsePrime计算卡，更是直接瞄准了未来3-5年超大规模模型的推理需求，依托Antoum2.0架构打造，对Transformer模型做了深度适配，开发者几乎不需要修改代码就能直接迁移部署，门槛降得非常低。

降本才是国产AI芯片的真正破局点

AI产业发展到今天，已经从技术尝鲜走到了产业普及的阶段。这个阶段最大的刚需不是更高的峰值算力，而是更低的推理成本。

国家数据局的数据显示，今年3月底我国日均Token调用量突破140万亿，和2024年初相比增长超千倍。

这样爆炸式的增长，本质上就是推理需求的爆发。当调用量涨了上千倍，如果成本不跟着降下来，没有任何一家企业能扛得住这样的支出。

稀疏计算刚好踩中了这个趋势，它能在保证模型精度不变的前提下，把单token的运行成本降到比主流GPU低得多的水平，在很多特定场景优势更加明显。

这也给所有国产AI芯片厂商提了一个醒：国产替代不是简单的“别人做什么我们做什么”，找到现有路线没有解决的痛点，从底层创新重构成本结构，才是真正的破局路径。

墨芯现在已经跑通了从芯片设计到量产落地的全链条，也构建了成熟的商业化闭环，团队预期明后年就能实现盈亏平衡。这对很多还在烧钱换规模的AI芯片创企来说，本身就是一个非常值得参考的样本。

黄仁勋说过，AI推理的增长不是100倍、1000倍，而是100亿倍。面对这样量级的增长，现有技术路线肯定满足不了降本需求，一定会有新的计算范式站出来接过接力棒。

稀疏计算是不是那个最终答案还不好说，但至少我们已经看到，国产AI芯片已经不再是跟着别人屁股后面追，开始有人敢从底层定义新的规则。当更多这样的玩家冒出来，国产AI芯片的黄金时代，才真的要来了。

#AI妙生图##芯片##人工智能##IPO##资本##算力网络#

展开阅读全文

更新时间：2026-05-30

标签：科技英伟融资格局芯片性能稀疏冗余模型成本底层路线需求场景

1 2 3 4 5

国产AI芯片拿下近10亿融资性能超英伟达这会改写格局吗

推理需求涨了10倍资本押注小众路线

MLPerf三次夺冠性能反超英伟达A100 H100

不是为了超车是换了一条赛道

降本才是国产AI芯片的真正破局点

国科微2026年半年业绩预测

教育部：不断满足随迁子女上好学的需求

历史不会重演，但会惊人相似：中国黄金价格极可能重走2015年老路

封闭公告

山东省“万企兴万村”行动推进会在枣庄市召开

天津市委书记陈敏尔与吉利控股集团董事长李书福一行座谈

月底截止！抓紧申报

OPPO手机背面圆形"泡泡"自拍

网购43寸康佳，收到26寸“康徍”！

618 买高端电视首选 RGB-Mini LED，海信小墨 E5S Pro 堪称大众家庭优选

纽约梅隆银行扩招实习生与分析师以迎接人工智能时代

2026京东618优惠券全品类怎么领大额红包加码福利？5月30日家电数码苹果手机大降价，618核心红包口令+福利满减规则+国补全套玩法汇总

三维光计算架构突破玻璃里写入AI神经网络能改变算力格局吗

万米高空当众闹事？男子执意触碰应急舱门，事发后态度惹众怒

全年最优入手时机！618锁定京东开门红，5月30日晚八点，全年最低价、625亿国补加码，数码家电低价来袭，抓紧时机放心选购

教育部：不断满足随迁子女上好学的需求

三维光计算架构突破玻璃里写入AI神经网络能改变算力

58元就能看遍全球黑科技？天津这波操作太宠粉了！

东百集团：丰琪投资、施章峰质押3730.00万股用于关联方

AI推理卡到绝望？这芯片速度翻倍，高盛直接提价至387

稀宇科技闫俊杰：中国AI行业今年将有大跨越

把论文写在黔山贵水间——贵州科技创新者背后的坚守与

神舟二十三号一飞冲天岛内风向突变两岸科技认同开始

彻底撕破脸！闻泰科技深夜发声明怒怼，80亿索赔只是第一步

回望“十四五”：那些我们一起见证的科技跨越

国产AI芯片拿下近10亿融资 性能超英伟达 这会改写格局吗

推理需求涨了10倍 资本押注小众路线

MLPerf三次夺冠 性能反超英伟达A100 H100

不是为了超车 是换了一条赛道

降本才是国产AI芯片的真正破局点

国产AI芯片拿下近10亿融资性能超英伟达这会改写格局吗

推理需求涨了10倍资本押注小众路线

MLPerf三次夺冠性能反超英伟达A100 H100

不是为了超车是换了一条赛道