开源大模型圈,华为今天扔了一颗重磅炸弹。
2026年6月30日,华为正式将openPangu-2.0-Flash模型开源上线,包含模型权重、基础推理代码和训推算子。
920亿总参数,512K超长上下文,深度适配昇腾算力——这套组合拳打下来,Flash版的定位非常清晰:让开发者用最低成本,跑动一个大体量模型。
92B体量,6B激活:轻量但够狠
Flash版最核心的技术看点,是稀疏MoE架构。
总参数量920亿,但实际推理时只激活60亿参数。这就像一支920人的团队,每次只调动最擅长的60人干活,效率高、成本低。
另一个亮点是512K上下文窗口,能一次性处理超长文档和复杂代码库,对Agent类应用尤其友好。
在算力适配层面,Flash版针对昇腾芯片深度调优,单卡推理吞吐率达到行业主流开源模型的两倍。在鸿蒙系统中,它对Agent任务也做了专项优化。
开源“全家桶”:不只是送权重
华为这次的开源策略明显比行业惯例走得更彻底。业界通常只开源模型权重和推理代码,而华为宣布将陆续开放七大组件,包括新增的预训练代码、后训练代码和训推算子。
余承东在HDC 2026上坦言,华为在大模型发展过程中“没做好,不应该”,如今由他重新牵头推进,“在我的字典里,没有第二,只有第一”。这次开源,算是华为“知耻后勇”的第一步。
Pro版预告:505B旗舰7月杀到
Flash版只是开胃菜。按照路线图,7月将开源openPangu-2.0-Pro,这才是真正的旗舰。
Pro版总参数量5050亿,激活参数180亿。在同样512K上下文支持下,它的复杂推理和任务规划能力将显著强于Flash版,堪称鸿蒙Agent的“超级大脑”。
更多开源组件将在下半年陆续放出。
写在最后
从Flash版的极致能效,到Pro版的技术冲刺,华为正在走一条差异化开源路线——“轻量部署+旗舰标杆”双线并行。对开发者来说,现在就能下载Flash版开玩;对追求极致性能的团队,Pro版值得蹲守7月。
盘古能否成为开发者最爱的国产基座,接下来几个月很关键。
更新时间:2026-07-02
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号