广东湛江80后创业者，用29万美元造AI模型，成功挑战硅谷上亿投资

一个来自广东湛江的80后，带着139名程序员，用不到30万美元的训练成本，做出了让整个硅谷都震惊的AI模型。

9月17日，国际顶级学术期刊《Nature》封面刊登了一篇特殊的论文，DeepSeek-R1的研究成果。这标志着什么？

这是全球首个通过权威学术期刊同行评审的大型语言模型，也是中国AI公司首次登上Nature封面的历史性时刻。

论文的通讯作者，正是DeepSeek创始人梁文锋，这个1985年出生的广东小伙，用一种全新的方式重新定义了AI训练的游戏规则。

打破"烧钱定律"，纯强化学习的革命性突破

在AI圈，有个不成文的"烧钱定律"，训练一个顶级大模型，动辄需要上亿美元，OpenAI训练GPT-4花了超过1亿美元，谷歌、Meta也都是几千万美元级别的投入。

但梁文锋和他的团队彻底颠覆了这套逻辑。

DeepSeek-R1的训练成本仅为29.4万美元，即使加上基础模型的约600万美元成本，总投入也远低于竞争对手，更关键的是，这个成本创造出了性能媲美OpenAI o1的推理能力。

秘密武器是什么？纯强化学习。

传统训练方法需要大量人工专家来标注推理步骤，就像请数学家逐步教AI解题，这不仅成本高昂，还给AI设定了"天花板"，模型很难超越人类的思维局限。

DeepSeek团队采用了截然不同的路径：只对最终答案给奖励，让AI自己探索解题过程。

这种"散养式"训练让模型展现出惊人的自我进化能力，它会自发延长思考时间，学会自我反思和验证，甚至出现"等等，让我重新考虑一下"的顿悟时刻。

在数学竞赛AIME 2024中，DeepSeek-R1-Zero的准确率从15.6%飙升至77.9%，使用自洽解码技术后更达到86.7%，远超人类选手平均水平。

从"技术竞赛"到"科学纪律"

更重要的突破在于DeepSeek开创的"程序价值"。

R1被认为是首个经历同行评审过程的主流LLM，这意味着什么？它将AI研发从"黑箱魔术"升级为"可验证科学"。

以往大模型公司只会展示结果，核心技术秘而不宣，DeepSeek却毫无保留地公开了所有训练细节，从学习率、采样温度到"每道题尝试16个答案"等具体参数，甚至连解决"中英夹杂"问题的"语言一致性奖励"计算公式都完整披露。

Hugging Face机器学习工程师Lewis Tunstall表示，R1是首个经历同行评审的大型语言模型，这是一个非常值得欢迎的先例，这种透明化让全球研究者都能学习和验证，为行业树立了开放与规范的新标杆。

DeepSeek还在论文中直接回应了外界的"蒸馏"质疑，明确表示R1并非通过模仿其他AI模型的输出来训练，而是基于互联网数据的纯正"血统"。

这种程序价值的意义远超技术本身，它将LLM研发纳入独立的同行评审体系，是从"技术竞赛"迈向"科学纪律"的关键一步。

梁文锋团队的成功更显得传奇。

DeepSeek研发团队只有139人，而OpenAI拥有1200名研究人员，这种"以小博大"的背后，是完全不同的人才理念和工作模式。

在北京融科资讯中心的办公室里，DeepSeek实行着近乎"理想化"的工作环境：没有KPI、不用打卡、以兴趣为导向。

梁文锋被员工形容为"极致的80后技术理想主义者"，每天就是"看论文、写代码、参与小组讨论"。

这个从广东湛江走出的小伙子，17岁考入浙江大学，从量化交易起家，一路低调前行，他说过：中国AI不可能永远跟随。

如今这句话正在成为现实。

值得一提的是，在Hugging Face上，R1已成为最受欢迎的开源模型，下载量超过1090万次。这个数字背后，是全球开发者对中国技术创新的认可。

DeepSeek-R1的成功证明了一个重要观点：技术创新不是靠砸钱就能解决的，关键在于找到正确的方法论。

梁文锋团队使用的GRPO(组相对策略优化)算法，巧妙地避开了传统PPO算法的高资源消耗问题，从基础的DeepSeek-V3 Base，到纯强化学习的R1-Zero，再到多阶段优化的最终版本R1，整个研发过程展现了扎实的工程能力和清晰的技术路线图。

结语

DeepSeek-R1登上Nature封面，不仅是中国AI的高光时刻，更是全球AI发展的重要里程碑。

它证明了开放、透明的研发模式能够推动整个行业的进步，也显示了中国技术团队正在从跟随者转变为引领者。

梁文锋的故事告诉我们：真正的技术突破，往往来自于对本质的深度思考，而非简单的资源堆砌，在AI这条赛道上，中国正在书写属于自己的传奇。

信源：
证券时报网 2025-09-18 DeepSeek，打破历史！中国AI的“Nature时刻”

展开阅读全文

更新时间：2025-12-15

标签：科技硅谷广东创业者模型湛江万美元中国技术团队成本同行时刻全球论文

1 2 3 4 5

广东湛江80后创业者，用29万美元造AI模型，成功挑战硅谷上亿投资

打破"烧钱定律"，纯强化学习的革命性突破

从"技术竞赛"到"科学纪律"

结语

快手深陷调查风波，是“罪有应得”还是另有隐情？

Fami通报道称Switch2本土销量已超过200万台，有望追平PS5标准版

院士专家齐聚第三届水生生物论坛在汉举办

美国升级 “机械战士” 技术人脑芯片植入成生物机器人研发核心方向

“风扇坏了”当事人被疯狂举报！原因令人不齿，奉劝某些网友善良

全球“买机工时榜”出炉：卢森堡3天，印度160天，你需要多少天？

XR周报：Meta发布三款新一代AI眼镜；传OpenAI正考虑开发智能眼镜

我国成功攻克世界级难题！

“双机场城市”即将上新！铜仁德江机场开始校飞，年内通航或无望

第五届世界生物圈保护区大会举办在即，杭州萧山机场很忙

会用AI和用好AI，是两种截然不同的结局，聪明的人早已拿它赚钱了

2025中国制造业企业500强发布山东71家企业上榜

美联储放话再降两次！黄金冲3744美元后暴跌，中方该如何应对

波兰这是给三国送上大礼！中吉乌铁路要加快，中欧班列要有变化

特朗普这个忙，日本到底帮不帮？日本的表态，要让美国失望了

美国升级 “机械战士” 技术人脑芯片植入成生物机器

全球“买机工时榜”出炉：卢森堡3天，印度160天，你需要多少

2025中国制造业企业500强发布山东71家企业上榜

中国攻克世界级难题！1.2万亿引爆西藏经济，领先世界半个

新华社权威速览｜家园更美！权威数据看“十四五”美丽中国

不能让中国如意，特朗普喊话阿富汗，与此同时中国大量抛美

ATP成都站：头号种子穆塞蒂晋级八强，中国组合止步双打第

库克尴尬了，这次中国人不爱iPhone17 Pro了？

美国科技就是强大，新智能设备推出，扎克伯格：它将取代手机

库克称只有苹果能做到的VC均热，是个什么技术？