寒武纪适配DeepSeekExp,同步开源推理引擎vLLM-MLU

9月29日,寒武纪-U(688256.SH)旗下官微发布消息称,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。

寒武纪还表示,公司一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。此前,公司对DeepSeek系列模型进行了深入的软硬件协同性能优化。

展开阅读全文

更新时间:2025-09-30

标签:科技   寒武纪   引擎   模型   算子   性能   软硬件   公司   极致   源代码   算法   架构

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top