提到芯片领域的巨头,不少人会想到英伟达,它凭借强大的GPU技术和完整生态,在全球占据主导地位。
而如今,中国也涌现出了一批能扛起自主研发大旗的企业,被大家称为“中国英伟达”,它们靠着100%全自研技术打破垄断,让国产芯片替代迎来了真正的曙光。

这并非偶然爆发,而是国产半导体产业多年深耕的成果。
此前,美国出台多轮晶圆代工限制新规,卡住先进制程芯片制造的咽喉,英伟达高端GPU在中国市场的供应彻底中断,直接催生了国产替代的迫切需求与市场空间。

英伟达CEO黄仁勋曾公开坦言,受美国出口管制影响,英伟达近乎100%退出了中国市场,其在国内的市场份额从95%急剧降至0%。
这一空白,为国产GPU企业的崛起提供了前所未有的机遇,也倒逼企业加速全自研突破。

在众多国产GPU企业中,壁仞科技的表现尤为突出。该企业由前商汤科技总裁张文于2019年创立,在“国产GPU四小龙”中,专注于高端云端大算力GPGPU领域,走出了一条差异化的技术突破之路。
2022年,壁仞科技发布首款通用GPU芯片BR100,这款芯片采用7nm制程,创新性应用Chiplet与2.5D CoWoS封装技术,将两颗计算核心封在一块硅Interposer上,性能达到全球领先水平。

BR100的算力表现十分亮眼,其16位浮点算力达到1000T以上,8位定点算力更是突破2000T,在发布时直接创造了全球算力纪录。更为关键的是,这款芯片的核心技术实现100%全自研,不依赖任何海外专利授权。
值得关注的是,壁仞科技是国产GPU企业中最早实现Chiplet芯粒封装技术商用落地的企业之一。在国产半导体受限7nm以下工艺的现实背景下,Chiplet技术成为突破瓶颈的关键。

Chiplet技术可通过混合不同工艺节点,比如5nm与12nm组合,实现与全先进制程芯片相当的性能,同时大幅降低对单一制程的依赖,为国产GPU规避工艺限制、实现性能突破提供了可行路径。
基于BR100及其衍生产品如BR104,壁仞科技打造了壁砺系列商用硬件产品线,目前已实现量产落地。该系列包含液冷、风冷OAM模组以及推理AI加速卡等多种产品,适配不同场景的算力需求。

壁砺系列产品依托原创的GPGPU芯片架构以及BIRENSUPA软件开发平台,能够完美支持业内主流的深度学习框架与模型,为AI计算、云端服务等广泛场景,提供高能效比、高通用性的强大算力支撑。
除了壁仞科技,摩尔线程也在全自研道路上稳步前行。在2025年底举行的开发者大会上,摩尔线程发布了新一代国产GPU架构“花港”,这款架构基于自主研发的元计算统一计算架构体系打造。

“花港”架构在多个核心领域实现突破,算力密度提升50%,能效提升10倍,支持全精度端到端计算。同时,它集成了新一代异步编程模型,可支持十万卡以上规模智算集群扩展,适配超大规模算力需求。
基于“花港”架构,摩尔线程公布了两款全新芯片的技术路线。其中“华山”芯片专注于AI训推一体与超大规模智能计算,将为万卡级智算集群提供稳定高效的算力支撑,填补国产高端训推芯片空白。

另一款“庐山”芯片则专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,还显著增强了纹理填充、原子访存能力及显存容量,适配3A游戏、高端图形创作等场景。
与此同时,国产GPU企业的资本化进程也在加速,为技术研发提供了充足的资金支撑。摩尔线程作为“A股国产GPU第一股”,上市5日涨幅超7倍,市值一度突破4400亿元,彰显了市场对国产GPU产业的认可。

沐曦股份的表现同样亮眼,上市首日涨幅达692.95%,刷新A股打新纪录,单签盈利高达36.26万元。壁仞科技也已叩开港股大门,获得备案冲刺“港股GPU第一股”,国产GPU“四小龙”齐聚资本市场。
国产GPU的崛起,离不开产业链的协同发力与政策扶持。“东数西算”工程的持续推进,为国产GPU提供了广阔的市场需求,而半导体产业相关扶持政策的落地,也为企业研发与量产保驾护航。

互联网云厂商也纷纷加速导入国产算力,腾讯云已全面适配主流国产芯片,阿里云通过一云多“芯”模式支持国产供应链,降低了国产GPU的商业化落地门槛,推动其快速进入实际应用场景。
中国电信也在助力国产GPU的落地应用,其研究院联合中科院计算所、沐曦等伙伴,成功完成业界首个面向国产算力的跨架构大模型推理技术验证,将大模型算子适配周期从“周级”压缩至“天级”。

此次技术验证构建了基于Triton的异构大模型推理框架,实现“一套框架代码、三芯透明迁移”,性能达到原生算子库90%,已完成10余款主流开源模型的端到端推理测试,核心指标表现优异。
华为也在为国产GPU生态赋能,2025年8月,华为宣布将其对标CUDA生态的CANN和Mind工具链全面开源开放,降低了国产GPU企业的生态构建成本,推动整个国产半导体产业链协同发展。

从市场前景来看,国产GPU的发展潜力巨大。数据显示,2024年中国AI智算GPU市场规模已达996.72亿元,预计至2029年将提升至1.03万亿元,市场规模实现十倍增长,为国产企业提供了广阔空间。
IDC数据预测,未来五年,国内训练和推理算力年复合增速将分别为50%和190%。推理对算力要求相对较低,且任务固定可针对性优化,成为国产GPU突破的重要切入点,加速其商业化落地进程。

目前,国产GPU已在多个领域实现突破,壁仞科技已在中国电信落地千卡集群,实现国内首个商业化异构混训方案;摩尔线程2024年推出第一代千卡集群,2025年达到1万卡,正向更高规模集群迈进。
中科曙光也联合20余家产业链企业发布AI计算开放架构,降低AI集群研发门槛,壁仞科技、华为、曦智科技等企业,也与新华三、中兴通讯等服务器厂商合作,推出超节点方案,完善产业链布局。

尽管取得了显著突破,但国产GPU仍面临一些挑战。
迁移成本过高仍是行业痛点,且在生态构建上与英伟达仍有差距,高端制程的限制也尚未完全突破,这些都需要企业在后续发展中持续发力解决。

但不可否认的是,国产GPU已经打破了海外企业的垄断格局,100%全自研技术的突破,让国产替代从口号变成了现实。
随着技术的不断成熟、产业链的持续完善,国产GPU即将迎来全面崛起的时刻。

未来,随着壁仞科技、摩尔线程等企业的持续发力,以及整个产业链的协同创新,国产GPU有望在全球市场中占据重要地位,为中国数字经济的高质量发展提供核心算力支撑,彻底摆脱对海外硬件的依赖。
更新时间:2026-02-11
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号