MiniMax M1模型挑战中国大语言模型霸主地位

总部位于上海的人工智能公司MiniMax发布了一款开源推理模型，在性能和成本方面对中国竞争对手DeepSeek以及美国的Anthropic、OpenAI和Google发起挑战。

MiniMax-M1于周一基于Apache软件许可证发布，因此是真正的开源模型，这与Meta的Llama系列（采用非开源的社区许可证）和DeepSeek（仅部分采用开源许可证）形成鲜明对比。

MiniMax在博客文章中自豪地表示："在复杂的生产力导向场景中，M1的能力在开源模型中名列前茅，超越了国内闭源模型，接近领先的海外模型，同时提供业界最佳的成本效益。"

根据博客文章，M1在多个基准测试（AIME 2024、LiveCodeBench、SWE-bench Verified、Tau-bench和MRCR）上与OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1、DeepSeek R1-0528和Qwen3-235B展开竞争，在不同程度上领先或落后于其他模型。虽然供应商提供的基准测试结果需要谨慎对待，但源代码已在GitHub上公开，用户可以独立验证其性能。

MiniMax明确表示要取代DeepSeek成为行业颠覆者，特别强调其上下文窗口（能够处理的输入量）达到100万个token，与Google Gemini 2.5 Pro相当，是DeepSeek R1容量的八倍。

在输出方面，该模型可以处理8万个token，优于DeepSeek的6.4万token容量，但略逊于OpenAI o3的10万token输出能力。

得到阿里巴巴集团、腾讯和IDG资本支持的MiniMax声称，其Lightning Attention机制通过改善注意力矩阵计算方式，提高了训练和推理效率，使M1模型在处理长上下文输入和推理时具有优势。

该公司声称："例如，在执行8万token的深度推理时，它只需要DeepSeek R1约30%的计算能力。这一特性使我们在训练和推理方面都具有显著的计算效率优势。"

这种更高效的计算方法，结合名为CISPO的改进强化学习算法（详见M1技术报告），转化为更低的计算成本。

MiniMax声称："整个强化学习阶段仅使用512块英伟达H800芯片运行三周，租赁成本仅为53.74万美元。这比最初预期少了一个数量级。"

展开阅读全文

更新时间：2026-01-31

标签：科技模型霸主地位语言成本许可证能力下文基准容量效率性能优势

1 2 3 4 5

MiniMax M1模型挑战中国大语言模型霸主地位

火山引擎携手 vivo：锚定用户场景，加速智能终端 AI 应用体验进阶

精智未来完成Pre-A3轮融资

即时零售带着巨额补贴搅局618：名酒跌破价，零售终端爆单

零高度逃逸试验成功，我国登月再进一步，我国月球探测关键突破

科学家利用超薄层使太阳能发电量增加1000倍

雷军：小米YU7样车已陆续到店

西渝高铁重庆段一在建隧道一氧化碳泄漏致7人被困有4人获救

全国宇航专用计量测试技术委员会获批成立『航天视窗』（1262）

我国新一代载人飞船“梦舟”零高度逃逸飞行试验取得圆满成功

亚马逊CEO告知员工：未来几年里你们中的一些人会被AI抢走饭碗

梦舟飞船零高度逃逸试验成功，我国向2030年前中国人登月的目标迈出坚实一步

罗马仕 49 万台充电宝紧急召回：多次安全事故与隐患背后

稳定币正式“转正”！美国参议院通过法案，全球支付格局要变天了

工业金属普跌，LME期铜收跌14美元

泰国总理通话录音引发争议第二大党宣布退出执政联盟

弘信电子在甘肃投资成立多家科技公司

证监会：支持在审未盈利科技型企业面向老股东开展增资扩

安泰科技：第九届董事会第二次临时会议决议公告

润欣科技：目前没有开展脑机接口业务

松霖科技：越南生产基地实现首单出货

外界不懂京东！刘强东谈公司没有死掉的原因：全球仅5家零

科技线重拾涨势，10只基金单日涨超4%

阿隆索：贝林厄姆有能力覆盖很大的区域姆巴佩不是典型9

共话生物医药前沿科技发展，“媒体进张江·生物医药专场

光弘科技：公司的生产的产品尚未直接应用于无人机和飞行