DeepSeek:推新模型降API调用价,与阿里排名靠前

【中国人工智能开发商DeepSeek推出实验性大模型,成本显著降低】中国人工智能开发商DeepSeek推出一款实验性大型语言模型,号称训练与推理能力显著提升,且能低成本运行。总部位于杭州的DeepSeek称,该模型采用稀疏注意力技术,可让API调用价格降低一半,API是企业和开发者接入AI模型主要付费方式。 DeepSeek在开发者社区HuggingFace发文,称新模型是“下一代AI产品线的重要进展”。随着国内外竞争加剧,中国科技企业不断升级自研大模型,上周阿里巴巴推出迄今最大最强新一代旗舰模型。 其实,谷歌与OpenAI等国际巨头2019年就探索过稀疏注意力技术。OpenAI当时指出,“稀疏模式”关注部分关键输入,可大幅提高超大规模输入效率。 DeepSeek在论文中介绍,新模型采用“闪电索引器”与“精细化的token选择机制”,确保注意力计算用于最相关token。周一晚间,华为云确认已“快速完成”对DeepSeek - V3.2 - Exp模型的适配工作。 目前,DeepSeek的V3.1版本与阿里巴巴通义千问Qwen3系列,在人工智能分析平台全球LLM排名中列中国前两名,仅次于国际厂商。

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

本文来自和讯财经,更多精彩资讯请下载“和讯财经”APP

展开阅读全文

更新时间:2025-10-05

标签:科技   阿里   模型   中国   人工智能   稀疏   注意力   阿里巴巴   开发者   开发商   华为   本文

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top