广东湛江80后创业者,用29万美元造AI模型,成功挑战硅谷上亿投资

一个来自广东湛江的80后,带着139名程序员,用不到30万美元的训练成本,做出了让整个硅谷都震惊的AI模型。

9月17日,国际顶级学术期刊《Nature》封面刊登了一篇特殊的论文,DeepSeek-R1的研究成果。这标志着什么?

这是全球首个通过权威学术期刊同行评审的大型语言模型,也是中国AI公司首次登上Nature封面的历史性时刻。

论文的通讯作者,正是DeepSeek创始人梁文锋,这个1985年出生的广东小伙,用一种全新的方式重新定义了AI训练的游戏规则。

打破"烧钱定律",纯强化学习的革命性突破

在AI圈,有个不成文的"烧钱定律",训练一个顶级大模型,动辄需要上亿美元,OpenAI训练GPT-4花了超过1亿美元,谷歌、Meta也都是几千万美元级别的投入。

但梁文锋和他的团队彻底颠覆了这套逻辑。

DeepSeek-R1的训练成本仅为29.4万美元,即使加上基础模型的约600万美元成本,总投入也远低于竞争对手,更关键的是,这个成本创造出了性能媲美OpenAI o1的推理能力。

秘密武器是什么?纯强化学习。

传统训练方法需要大量人工专家来标注推理步骤,就像请数学家逐步教AI解题,这不仅成本高昂,还给AI设定了"天花板",模型很难超越人类的思维局限。

DeepSeek团队采用了截然不同的路径:只对最终答案给奖励,让AI自己探索解题过程。

这种"散养式"训练让模型展现出惊人的自我进化能力,它会自发延长思考时间,学会自我反思和验证,甚至出现"等等,让我重新考虑一下"的顿悟时刻。

在数学竞赛AIME 2024中,DeepSeek-R1-Zero的准确率从15.6%飙升至77.9%,使用自洽解码技术后更达到86.7%,远超人类选手平均水平。

从"技术竞赛"到"科学纪律"

更重要的突破在于DeepSeek开创的"程序价值"。

R1被认为是首个经历同行评审过程的主流LLM,这意味着什么?它将AI研发从"黑箱魔术"升级为"可验证科学"。

以往大模型公司只会展示结果,核心技术秘而不宣,DeepSeek却毫无保留地公开了所有训练细节,从学习率、采样温度到"每道题尝试16个答案"等具体参数,甚至连解决"中英夹杂"问题的"语言一致性奖励"计算公式都完整披露。

Hugging Face机器学习工程师Lewis Tunstall表示,R1是首个经历同行评审的大型语言模型,这是一个非常值得欢迎的先例,这种透明化让全球研究者都能学习和验证,为行业树立了开放与规范的新标杆。

DeepSeek还在论文中直接回应了外界的"蒸馏"质疑,明确表示R1并非通过模仿其他AI模型的输出来训练,而是基于互联网数据的纯正"血统"。

这种程序价值的意义远超技术本身,它将LLM研发纳入独立的同行评审体系,是从"技术竞赛"迈向"科学纪律"的关键一步。

梁文锋团队的成功更显得传奇。

DeepSeek研发团队只有139人,而OpenAI拥有1200名研究人员,这种"以小博大"的背后,是完全不同的人才理念和工作模式。

在北京融科资讯中心的办公室里,DeepSeek实行着近乎"理想化"的工作环境:没有KPI、不用打卡、以兴趣为导向。

梁文锋被员工形容为"极致的80后技术理想主义者",每天就是"看论文、写代码、参与小组讨论"。

这个从广东湛江走出的小伙子,17岁考入浙江大学,从量化交易起家,一路低调前行,他说过:中国AI不可能永远跟随。

如今这句话正在成为现实。

值得一提的是,在Hugging Face上,R1已成为最受欢迎的开源模型,下载量超过1090万次。这个数字背后,是全球开发者对中国技术创新的认可。

DeepSeek-R1的成功证明了一个重要观点:技术创新不是靠砸钱就能解决的,关键在于找到正确的方法论。

梁文锋团队使用的GRPO(组相对策略优化)算法,巧妙地避开了传统PPO算法的高资源消耗问题,从基础的DeepSeek-V3 Base,到纯强化学习的R1-Zero,再到多阶段优化的最终版本R1,整个研发过程展现了扎实的工程能力和清晰的技术路线图。

结语

DeepSeek-R1登上Nature封面,不仅是中国AI的高光时刻,更是全球AI发展的重要里程碑。

它证明了开放、透明的研发模式能够推动整个行业的进步,也显示了中国技术团队正在从跟随者转变为引领者。

梁文锋的故事告诉我们:真正的技术突破,往往来自于对本质的深度思考,而非简单的资源堆砌,在AI这条赛道上,中国正在书写属于自己的传奇。

信源:

证券时报网 2025-09-18 DeepSeek,打破历史!中国AI的“Nature时刻”

展开阅读全文

更新时间:2025-09-23

标签:科技   硅谷   广东   创业者   模型   湛江   万美元   中国   技术   团队   成本   同行   时刻   全球   论文

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top