当大家还在争论哪个人工智能比较厉害的时候、当业界还沉迷算力军备竞赛的时候,deepseek却用29.4万美元,再度创造历史。
在AI烧钱如流水的时代,DeepSeek却仅凭29.4万美元的增量投入,便登上了《自然》封面,打破了巨头们“算力即王道”的铁律,这笔钱比一个高官的年薪都要低,却能训练出与OpenAI相提并论的推力模型,而创造这个奇迹的人,竟还只是个高中生,所以这个人是谁?又有什么厉害之处?
在一个动辄烧掉数千万美元、以百亿资本为入场券的行业里,一个增量训练成本仅为29.4万美元的项目是什么概念?这大概相当于一名企业高管的年薪,然而就是这样一笔“微不足道”的投入,却敲开了《自然》杂志的封面。
人工智能的战场似乎早已定下了规则,算力、数据、资本,这三者构筑起一道普通玩家无法逾越的铁壁,巨头们在这里进行着一场军备竞赛,比谁的参数更多,谁的GPU集群更大,这套玩法简单粗暴,却也昂贵得令人窒息。
但DeepSeek的故事却告诉我们,游戏规则是可以被改写的,他们的胜利关键不在于省钱,而在于他们从一开始就没打算在别人的主场上玩。
他们发动了一场非对称战争,武器库里装的不是更多的H800显卡,而是被行业巨头们在狂飙突进中选择性忽视的三样东西,极致的算法杠杆、不计代价的学术公信力,以及对“天才”这两个字的全新理解。
DeepSeek的核心突破藏在一种近乎“少即是多”的工程哲学里,他们用事实证明,一个精巧的算法设计,其威力可以几何级数地超越单纯的资源堆砌。
当前主流的模式更像是一种“圈养”,研究员们费尽心力准备好标准解题步骤,然后逼着模型去模仿,但DeepSeek不这么干,他们选择了“放养”,他们采用纯粹的强化学习框架,只告诉模型最终答案的对错,至于过程需要它自己去闯、去试错。
这种“只给目标,不给路径”的思路,意外地解放了模型的潜力,它不再是一个只会背答案的模仿者,而变成了一个在黑暗中摸索、自主进化的探索者。
而最惊人的是,在这个过程中,模型自发地涌现出了“自我反思和验证”的行为,它学会了自己检查自己的推理过程,这是一种真正意义上的智能。
这种方法的威力不容小觑,一个基础模型的准确率只有可怜的15.6%,但在经过80小时强化学习“放养”后诞生的R1模型,准确率直接飙升到了77.9%。
如果再结合一种名为“自洽解码”的技术,这个数字甚至能达到86.7%,足以超越90%的人类参赛者,与OpenAI的王牌模型打成平手。
在人工智能这个信任极度稀缺的行业里,DeepSeek做出了一个反直觉的选择,他们将别人视若珍宝的商业机密,转化为了自己的科学信誉,通过最严苛的学术审查和近乎彻底的开源,他们构建了一道比任何技术壁垒都更难被逾越的护城河。
当OpenAI等巨头还在指责他们使用ChatGPT的输出进行训练时,DeepSeek没有选择在社交媒体上打口水仗,而是默默地在2月12日将论文投给了《自然》杂志。
接下来的五个月,这篇论文经历了由八位顶级专家组成的团队的轮番审视,评审维度覆盖了原创性、方法论和鲁棒性等方方面面。
更罕见的是,整个审稿意见和作者的回复都被完整公开,这是一次代价高昂的自证,但战略价值巨大,当7月17日论文被接收并作为封面文章发表时,它不仅为R1的成果盖上了全球最权威的学术钢印,也成了对所有原创性质疑的终极回应。
《自然》甚至专门为此发表社论,呼吁所有AI公司都应接受这样的学术审查,而面对数据来源的“原罪”问题,DeepSeek同样选择了坦诚。
他们主动承认用于训练V3基础模型的数据中,包含了12%由AI生成的内容,但坚决否认直接复制竞争对手的输出。
这种坦诚赢得了无数人的信赖,在开源平台上,R1系列模型的下载量迅速突破1090万次,把大名鼎鼎的LLaMA2都甩在了身后,GitHub上的星标数也达到了惊人的91.1k,这正是DeepSeek想要的,用信誉撬动生态,打破巨头的技术垄断。
DeepSeek的成功当然离不开人为的努力,在这个行业里,大家习惯了用千万年薪去挖功成名就的大牛,但DeepSeek的创始人梁文锋却相信顶尖人才可以自我培养,他的团队里,核心岗位上坐着不少应届生和年轻工程师。
这种理念最极致的体现,就是涂津豪的出现,他不是某个被挖来的硅谷大神,而是一名17岁的高二学生,但他绝非一个被挂名的“天才少年”。
在加入DeepSeek之前,他独立开发的一套名为“Thinking-Claude”的提示词方法论,通过目标拆解、场景引导和逻辑校验三层设计来增强模型的推理能力,早已在GitHub上获得了15.6k的星标,甚至被斯坦福和MIT的研究者引用。
更具说服力的是,在2024年的阿里巴巴全球数学竞赛AI赛道上,涂津豪单枪匹马,融合强化学习和蒙特卡洛树搜索,以92%的惊人准确率夺得第一名,把第二名78%的成绩远远抛开,他的解题时间仅为28分钟,也远快于平均的40分钟。
一个能让17岁高中生成为《自然》封面论文核心贡献者的环境,颠覆了传统AI研发那种等级森严的精英实验室模式,这是DeepSeek的文化与一个原生天才之间发生的奇妙共振,或许这也是deepseek取得如此成功的原因之一。
信息来源:
更新时间:2025-09-23
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号