壁仞科技率先完成MiniMax M3大模型,国产算力协同再提速

2026年6月12日晚,国产大模型公司MiniMax正式开源新一代通用模型MiniMaxM3。与此同时,国产GPU企业壁仞科技宣布,旗下壁砺166系列基于SGLang推理框架,成功完成该模型的"Day0"适配与调优,继续展现了其全栈技术能力在支持国产AI生态建设方面的持续投入。此前,壁仞科技已同步高效适配MiniMaxM2.1、M2.5、M2.7等多款模型,并在模型精度和稳定性方面表现优异。

根据官方介绍,MiniMaxM3采用全新的自研稀疏注意力架构MSA(MiniMaxSparseAttention),是国内首个同时具备"前沿Coding能力、1M超长上下文、原生多模态"三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。

至目前,壁仞科技已成功支持20余款领先大模型的"Day0"级适配。壁砺166系列产品此前已完成对包括MOSS-TTS、智谱GLM-5、MiniMaxM2.5、DeepSeek、千问Qwen3.5在内的多款AI大模型的高效兼容与适配,并于2026年4月率先完成对月之暗面KimiK2.6模型的接入与推理适配。

展开阅读全文

更新时间:2026-06-16

标签:科技   模型   上下文   能力   高效   注意力   此前   组合   长上   余款

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034903号

Top