观点网讯:7月30日,阿里通义千问推出新模型
Qwen3-30B-A3B-Instruct-2507,以提升AI长文本理解能力至256K,并优化参数效率。
该模型采用非思考模式,仅激活3B参数即可媲美Gemini 2.5-Flash和GPT-4o等闭源模型性能。目前已开源。
另据官方博文披露,
Qwen3-30B-A3B-Instruct-2507模型的参数总量为305亿,激活参数为33亿,非嵌入层数量为299亿,网络层数为48层,专家数为128个,激活专家数为8个,上下文长度原生支持262144个tokens。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
更新时间:2025-08-02
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号