从1亿+到29.4万！DeepSeek让AI告别烧钱时代

最近AI圈出了个大新闻，中国的DeepSeek把自家R1模型的论文发上了《自然》，这事儿本身就够炸的，更让人惊掉下巴的是，这模型训练推理能力才花了29.4万美元。

我刚看到这数的时候还以为眼花了，反复确认好几遍才敢相信，要知道以前想搞个能上顶刊的AI模型，没个几亿根本拿不下来。

29.4万美元的“炸弹”：戳破AI圈的烧钱迷思

DeepSeek这波操作，直接给整个行业来了个“降维打击”，今年年初R1刚亮相时，大家都觉得这模型性能强、还开源，成本肯定低不了，就是没人知道具体数。

直到最近论文一公开，512块H800芯片，80小时，29.4万美元搞定推理训练，基础模型也才600万美元。

路透社、CNN这些美媒都看懵了，CNBC直接说这钱干了超级大厂才敢碰的活，戳破了“没顶尖GPU玩不了AI”的说法。

本来想觉得就是DeepSeek运气好，后来发现跟同行一对比才知道多厉害，2023年OpenAI的奥尔特曼说他们基础模型训练成本远超1亿美元，这差距可不是一点半点。

以前AI圈总觉得“烧钱越多越牛”，不少团队一门心思凑GPU，好像没堆够数量就没底气。

DeepSeek这事儿算给大家提了个醒，不是钱花得少就做不出好东西，关键是怎么把钱花在刀刃上。搞不清那些还在盲目砸钱的团队，看到这数会不会重新算算账。

从R1-Zero到R1：AI自己“悟”出解题门道

光成本低还不够，能做到性能不打折，背后的技术才是真门道。

R1能有现在的本事，全靠它的前身R1-Zero打基础，这R1-Zero跟别的AI不一样，不用人教套路，就靠纯强化学习自己练，答对加分，答错扣分，连思考步骤都不规定。

在2024年AIME数学测试里，它的准确率从15.6%一路涨到77.9%，开了自洽解码后直接飙到86.7%，比不少人类选手还厉害。

更有意思的是，训练的时候它还会主动延长思考链，有时候输出上万个token，突然冒一句“等一下，我需要验证”。

如此看来，这AI都快有“反思能力”了，而且全程没人指导，这哪是训练模型，简直是看AI“开窍”。

不过R1-Zero也有缺点，语言混用、读着费劲，没法直接用。

无奈之下，团队搞了多轮精炼，先用好数据修语言问题，再强化学习提推理能力，接着扩知识面，最后对齐人类偏好。

很显然，这套流程没走一点弯路，既保住了R1的深度推理能力，还让它能跟人顺畅聊天，数学、编程这些硬活也没落下。

透明化+开源：给AI行业立了新规矩

DeepSeek最让人佩服的，不只是成本和技术，还有它的透明。

之前有美国官员质疑，说用H800这种“阉割版”芯片练不出高性能模型，还造谣他们违规弄了H100。

结果DeepSeek在《自然》的补充文件里直接明说，R1全程用的都是合法买的H800，一点没含糊。

而且他们不光回应质疑，还把训练细节、强化学习策略、数据来源全公开了，谁都能复现。

以前AI圈不少公司都把模型当“黑箱”，藏着掖着怕别人学去，DeepSeek这波操作，相当于把“家底”亮出来，反而让大家更信任。

更关键的是，R1还开源到了HuggingFace，下载量破了1090万次，成了首个经同行评审的主流大语言模型。

《自然》都夸这事儿有价值，让大模型从公司私藏变成了能科学验证的系统，毫无疑问，这给行业指了条新路子：AI竞争不是比谁GPU多、烧钱狠，而是比谁策略巧、够透明。

现在再看AI圈，DeepSeek这一课算是教透了，以前大家总觉得搞AI得靠“钞能力”，中小团队根本没机会。

现在好了，有了低成本、可复现的路子，更多人能扎进来做研究。如此看来，AI不再是少数大厂的“烧钱游戏”，这才是行业该有的样子。

展开阅读全文

更新时间：2025-09-30

标签：科技时代模型能力团队行业门道成本自然语言迷思下载量

1 2 3 4 5

中国成功研制！“创造新世界纪录”

记者从中国科学院合肥物质院等离子体物理研究所获悉，由该研究所牵头，联合国内多家科研机构与大学共同研制的全超导磁体，近日实现了35.1特斯拉中心稳态磁场，创造了新的世界纪录。

10月1日—4日，免费开放！

长光卫星航天科普教育基地2025年“十一”假期期间开放公告2025年“十一”假期将至，为弘扬科学精神，普及航天知识，满足广大群众假期期间科普参观需求，长光卫星航天科普教育基地开

3000亿砸出来的南水北调，12年调水数据曝光，这笔账到底用到哪了

2014年12月12日，南水北调中线一期工程正式通水，从此长江水奔流北上，滋润着华北干渴的土地。到现在，这项工程已经运行了十多年，光是东、中线一期总投资就突破了3000亿，不是小数目。

轮到中国卡脖子了，220亿国产巨头，把激光雷达做到了世界第一

文 | 锐观经纬编辑 | 锐观经纬最近关注自动驾驶圈的朋友可能会发现一个有意思的矛盾：一边是小鹏 G7 改款直接去掉激光雷达，比亚迪 10 万级的海豚、海豹智驾版也换上纯视觉方案

钱再多有什么用？蔡磊深夜宣告奇迹已发生，才懂倪萍那番话含金量

从确诊“渐冻症”到如今，蔡磊已经坚持抗争了7个年头。打破了医生对他只有3-5年寿命的预测。而最近蔡磊深夜发文带来好消息，宣告奇迹已经发生。这时候大家才懂倪萍当年那番话的

接连挂上新招牌，“银座CC”悄然入局社区便利赛道｜大鱼财经

9月24日晚，济南东关大街上，原仲家汇超市的招牌被工人们连夜拆下；第二天晚上，白底橙字的银座CC新招牌已悄然亮起。这标志着在“统一银座”时代落幕后，银座正以一个全新的子品牌，进

宁夏石嘴山东安35千伏变电站投运

9月26日，宁夏石嘴山东安35千伏变电站正式建成投运，为平罗县高仁乡、陶乐镇区域的产业发展与民生保障提供了坚实电力支撑。点击链接查看视频宁夏石嘴山东安35千伏变电站投运

航班竟提前15小时起飞！乘客损失谁来赔？

航班说走就走，提前 15 小时起飞，你赶得上吗？这事就落在了龙江航空身上。9 月 28 日，有乘客发现原定 9 月 29 日中午 12 点起飞的航班（航班号：龙江航空 LTXXX），突然被调整至 28 日晚

刚刚，金价再破新高！多家品牌确认：涨价

9月29日，贵金属价格再度走强。现货黄金盘中突破3800美元/盎司，续创历史新高，日内涨超1%。今年以来累计上涨近45%。现货白银价格盘中也突破47美元/盎司关键关口，年内累计涨幅超60

连锁餐饮企业监管新规出台

市场监管总局28日发布《餐饮服务连锁企业落实食品安全主体责任监督管理规定》。这一规定旨在加强连锁餐饮企业食品安全监管，督促其落实食品安全主体责任。连锁餐饮企业具有

国寿财险酒泉市中心支公司被罚10万元：给予投保人合同外利益等

来源：金融一线9月29日金融一线消息，据酒泉金融监管分局行政处罚信息公开表显示，中国人寿财产保险股份有限公司酒泉市中心支公司因给予投保人合同外利益、车险销售人员垫付保费

广西贵港建设面向东盟的现代制造业基地

广西贵港市市长林海波28日介绍，贵港市加快建设服务粤港澳大湾区和东盟的现代制造业基地，建成中国—东盟生活用纸产业园，成为中国第四大电动车生产基地，产品销往泰国、越南、印度

官宣：这一银行将被注销

近日晚间邮储银行发布公告称为进一步优化管理及业务架构将吸收合并下属全资子公司中邮邮惠万家银行有限责任公司（以下简称邮惠万家银行）邮储银行表示吸收合并完成后邮惠万家

国家发改委征求意见！

9月29日，国家发改委就《电力重大事故隐患判定标准及治理监督管理规定（公开征求意见稿）》向社会公开征求意见。在征求意见稿中，第二章重大隐患判定标准，由2022年版判定标准的8条（

连环危机爆发,川普对城市开战,政府停摆在即,37万亿美债拖垮美国

美国如今正站在多重危机的十字路口，俄勒冈州波特兰市的街头正在被政治博弈的硝烟笼罩，国会山还不断回响着政府可能停摆的警报声，而高达37万亿美元国债市场正在被经济困境死死压

上滑加载更多 ↓

从1亿+到29.4万！DeepSeek让AI告别烧钱时代

29.4万美元的“炸弹”：戳破AI圈的烧钱迷思

从R1-Zero到R1：AI自己“悟”出解题门道

透明化+开源：给AI行业立了新规矩

中国成功研制！“创造新世界纪录”

10月1日—4日，免费开放！

3000亿砸出来的南水北调，12年调水数据曝光，这笔账到底用到哪了

轮到中国卡脖子了，220亿国产巨头，把激光雷达做到了世界第一

钱再多有什么用？蔡磊深夜宣告奇迹已发生，才懂倪萍那番话含金量

接连挂上新招牌，“银座CC”悄然入局社区便利赛道｜大鱼财经

宁夏石嘴山东安35千伏变电站投运

航班竟提前15小时起飞！乘客损失谁来赔？

刚刚，金价再破新高！多家品牌确认：涨价

连锁餐饮企业监管新规出台

国寿财险酒泉市中心支公司被罚10万元：给予投保人合同外利益等

广西贵港建设面向东盟的现代制造业基地

官宣：这一银行将被注销

国家发改委征求意见！

连环危机爆发,川普对城市开战,政府停摆在即,37万亿美债拖垮美国

30亿参数模型已成各家旗舰机起跑线

科普暖夕阳！金甲社区为老年人搭建科技“桥梁”

全国科普月 | 北京青少年科技后备人才——“地理地质

数字赋能古城广州数字科技（西安）产业园项目落户西安高

美国10万美元签证费吓跑人才！欧洲趁机加价收人，美国科技

湖南省委书记沈晓明的新判断：低成本已成为决定年轻人流

牛油更“牛”火锅更“火”│国家标准《动物油脂牛油

特朗普带队，将2000亿美元投入英国！却拿走了AI时代最核心

复制马斯克想法？小鹏汽车放弃激光雷达，转投视觉方案，马斯

AI3D破圈：《蛋仔派对》玩家一键造模型，小团队也能做大世