DeepSeekExp官宣发布，性能更强，API价格腰斩

9月29日，DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。

DeepSeek在官方微信号介绍表示，该版本作为迈向下一代架构的重要中间步骤，在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制，旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。

目前，华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作，最大可支持160K长序列上下文长度。

最新核心技术突破：DeepSeek Sparse Attention（DSA）

DeepSeek Sparse Attention（DSA）首次实现了细粒度稀疏注意力机制，在几乎不影响模型输出效果的前提下，实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响，DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上，DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。有效性得到了初步验证。

API成本将腰斩

随着新模型服务成本的显著降低，DeepSeek 同步采取了重磅举措：大幅下调官方 API 价格，降价幅度超过 50%，新价格已即刻生效。目前，官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。

DeepSeek 现已将 DeepSeek-V3.2-Exp 模型在 Huggingface 和 ModelScope 平台上全面开源，相关论文也已同步公开。

作为一款实验性版本，DeepSeek 认识到模型仍需在更广泛的用户真实场景中进行大规模测试。为便于开发者进行效果对比，DeepSeek 为 V3.1-Terminus 版本临时保留了 API 访问接口，且调用价格与 V3.2-Exp 保持一致。该对比接口将保留至北京时间 2025 年 10 月 15 日 23:59。

此外，为支持社区研究，DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子，包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验时，优先使用基于 TileLang 的版本，以便于调试和快速迭代。

本文系观察者网独家稿件，未经授权，不得转载。

展开阅读全文

更新时间：2025-12-11

标签：科技性能价格模型版本稀疏注意力效率官方架构大幅华为

1 2 3 4 5

DeepSeekExp官宣发布，性能更强，API价格腰斩

首届医学人工智能大会东道主医学AI论坛召开

苏州创新药研究院揭牌

海报丨2025辽宁省航空产业发展大会暨沈阳法库国际飞行大会今日开幕

2025年青海“青海电信·天翼杯” 网络与信息安全职业技能竞赛在西宁启动

中国科学院兰州分院专家来新区开展产学研对接活动

快递集体涨价！到底是谁扛不住啊？

总投资近5亿元！山西一重点工程项目建设有新动态

我国再获勘探重大突破！

能读书观展！还能体验AI？解锁“未来之城”的“未来”图书馆

全国最大、西南首家XR影院！越界影院又“上新”！

覆盖“吃住行游娱购医”！双节前美团推出亿元补贴

南极电商：已开设的超级南极人门店在商场具有较强竞争力

特斯拉Q3交付超预期，股价却向下！投资者因何不买账？

特斯拉餐厅开业72天卖出5万个汉堡

1600万人离开故土不愿回去，学生毕业拒绝返乡，河南为啥留不住人

官方：国际足联公布世界杯票价，球票起售价低至45英镑

湖人官方：东契奇将不会出战4日对阵太阳和6日对阵勇士的

上代旗舰降价卖，下代旗舰10月来！国庆消费电子火爆：华为苹

国际数据公司IDC：华为超越苹果，登顶全球智能手表市场

小米HyperOS 2遇应用兼容问题，菲律宾用户受影响，官方正

与时俱进，共谱新篇：北京镭内容信息科技与仁科互动成功续

宜宾生态科技创新园开园

四川快递收件价格调整多家企业10月起涨价

美股三大指数齐创新高！特斯拉利好出尽回落，科技股强势反

2026年发布？苹果新款智能眼镜功能一览配备AI大模型