DeepSeek创始人梁文锋,再次震动全球AI领域:R1训练真29.4万美

当业界沉迷算力军备竞赛,DeepSeek梁文锋却用29.4万美元,让R1模型以智力杠杆撬动AI未来,登上《自然》封面。

DeepSeek创始人梁文锋的最新言论与成果确实引发了全球AI领域的震动,它证明:高级推理无需天价投入,算法效率远胜资本规模。


2025年9月17日,当最新一期《自然》杂志的封面公之于众时,全球AI领域的目光瞬间被锁定了。

封面上,不是某个高深莫测的生物学发现,而是一个主流大语言模型的名字:DeepSeek-R1。

它是首个通过这等级别综合期刊同行评审的大模型。但真正引爆行业的,是这背后一个让人难以置信的数字——29.4万美元。

这个数字,约合人民币208万,是R1模型的增量训练成本。

在全球AI巨头动辄豪掷数亿、数十亿美元进行算力军备竞赛的今天,这笔钱简直像个玩笑。

所以,这不仅仅是一次技术上的胜利,更像是一场哲学上的颠覆。

智力杠杆才是真武器

R1模型采用的,是一种被内部称为“放养”而非“圈养”的训练哲学。

这套纯强化学习框架,跟主流的监督学习模式完全是两条路。

它不强制模型去模仿人类标注好的、一步一步的“标准解题路径”。相反,它只告诉模型最终答案的对与错,然后把它扔进一个“黑箱”里,让它自己去摸索、去试错、去寻找最优解。

你可以把它想象成一个去中心化的学习社区,而不是一个有“中央裁判”的考场。

在这个社区里,一群模型相互评估、互为裁判,在竞争与协作中共同进化。

该设计简直是天才,它不仅直接砍掉了30%的算力资源消耗,更在方法论上实现了系统的闭环,彻底摆脱了对外部独立评估算法的依赖。

2024年美国数学邀请赛上,基础模型的准确率只有可怜的15.6%。但经过这种“自主学习”模式的训练,准确率飙升至77.9%,如果再结合自洽解码技术,最终成绩可以达到86.7%。

这个分数,已经超越了90%的人类参赛选手,性能水平与当时强大的OpenAI-o1-1217模型相比,也毫不逊色。

最让人着迷的是,在解题过程中,模型自发地涌现出了一些类似“等等,我再检查一遍”的自我反思和验证行为。

这已经不是机械的模仿了,这是真正在形成自己的推理策略。

俄亥俄州立大学的专家对此评价道,R1发布后,几乎影响了所有后续采用强化学习的大模型研究。

穷出来的工程艺术

惊人的29.4万美元成本背后,其实是一种被地缘政治限制、资本效率要求等多重“约束”硬生生逼出来的智慧。

首先要明确,29.4万美元是“增量成本”,是训练R1这个特定推理模型的费用。

它的背后,是DeepSeek先期投入约600万美元开发DeepSeek-V3Base这个基础模型的“预投资”。

DeepSeek在香港建立了一个算力中心,通过租赁的方式,使用了512张英伟达H800GPU。

当别人在为顶级芯片一掷千金时,他们选择了一条迂回但高效的道路,在逆境中找到了解决方案。

硬件上,他们的工程师团队硬是把硬件利用率压榨到了行业平均水平的三倍。

数据上,他们对基础模型的数据进行了严格的“去污”处理,确保R1涌现出的推理能力是真实训练所得,而不是靠“数据污染”走了捷径。

最后是人才。创始人梁文锋,这位1985年出生于广东湛江的浙大本硕,曾创办量化投资公司幻方科技,他深信顶尖人才可以自己培养。

DeepSeek的核心岗位上,不乏应届生和年轻的工程师。

这种团队结构本身,就是对成本和创新效率的一种最优化配置,正如梁文锋所言:“感谢中国工程师的务实精神。”

这种低成本、高效率的模式,给市场带来了巨大的冲击波。

消息一出,英伟达股价应声单日下跌12%,谷歌和OpenAI等巨头也被迫重新评估自己的技术路线和成本策略。

裸奔式开源才是王道

在一个充斥着技术秘密和夸大宣传的行业里,DeepSeek选择了一条最艰难,也最智慧的路——彻底的开放与透明。

他们没有把R1当成商业黑箱,而是通过《自然》的严苛同行评审和在HuggingFace上的完全开源,把商业机密转化为了科学信誉。

这种信誉,比任何市场营销都更有力量。

登上《自然》封面,本身就是一次双重认证。它不仅证明了你的技术实力,更认证了你的科学态度。

长达8个月的评审周期里,DeepSeek团队回应了评审们提出的23项尖锐质疑,公开了数据类型、安全性能等大量核心细节。

他们甚至直面了行业里最敏感的“数据原罪”争议。

DeepSeek坦诚地公开,其基础模型训练数据中,包含了12%的AI生成内容。

但他们也坚决否认了直接“蒸馏”或复制竞争对手输出的指控。

这种坦诚,远比含糊其辞更能赢得学术界和开发者的尊重。

开源,则将这种信任转化为了巨大的杠杆效应。

在HuggingFace上,R1、R1-Zero以及相关的蒸馏模型权重,下载量迅速突破1090万次,超越了曾经的开源王者LLaMA2。

GitHub上的星标数也达到了惊人的91.1k。它已经成为了事实上的行业基础设施之一。

这种开放,直接赋能了整个生态。

深圳一家从事医疗影像分析的初创公司,利用DeepSeek的开源模型,仅花费约10万美元就搭建起了一套先进的推理系统,这在过去是不可想象的。

它打破了巨头对先进AI应用的垄断,也为华为昇腾等国产芯片提供了一条看得见的、高效率的应用路径。

结语

回过头看,DeepSeek的故事,远不止于一个“便宜”的模型,它是一个关于选择的故事。当整个行业都在向“更大、更贵、更强”的单一维度狂奔时,梁文锋和他带领的这支年轻团队,选择了另一条路。

他们证明了,在算力壁垒面前,精巧的算法是更锋利的武器。

在资源限制面前,极致的工程优化能创造奇迹。

参考资料

展开阅读全文

更新时间:2025-09-20

标签:科技   创始人   领域   全球   梁文锋   模型   行业   成本   数据   杠杆   团队   自然   基础   黑箱   算法

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top