美国华裔女院士李飞飞:低成本成功复刻Deepseek,性能媲美顶级AI

2025年1月27日,国产AI“Deepseek”登录美国地区手机应用商店,甚至还超过了ChatGPT,不仅如此还引发了美国多支科技股的暴跌。

特朗普更是直言Deepseek的出现,给整个美国相关产业敲响警钟!

然而就在Deepseek火爆的同时,一位来自美国华裔女院士用低成本的AI模型研制而成。

那么,这款低成本的AI到底有多强呢?它的创始人是如何完成这一壮举呢?

院士出手

李飞飞是斯坦福大学的教授,更是美国科学院院士,在AI领域摸爬滚打几十年,是公认的行业大佬。

之前AI圈一直有个共识,想做顶级AI模型,必须砸钱、砸算力、砸海量数据,动辄几百万、上千万美元的投入,普通团队想都不敢想。

Deepseek之前就凭着“低成本”出圈,被称为AI界的“价格屠夫”,它的出现,已经让很多科技公司感受到了压力。

没人想到,李飞飞团队更狠,直接用不到50美元的成本,就做出了一个和Deepseek性能差不多的模型,取名s1-32B。

这事不是炒作,有李飞飞团队发表的公开论文为证,还有业内专家的实测验证。消息一出来,全球AI圈都沸腾了,有人说这是AI成本革命的又一个里程碑,也有人说,李飞飞这是要改写AI行业的游戏规则。

李飞飞团队做这个模型,不是凭空创造,而是基于阿里已经成熟的通义千问Qwen2.5-32B模型,做了监督微调。

简单说,就是站在“巨人的肩膀上”优化,不用从零开始搭建模型,节省了大量的时间和成本。

低成本秘

很多人好奇,不到50美元,怎么可能做出顶级AI模型?

首先,他们没有用海量数据,而是精心筛选了1000个问题,做成了一个小型数据集,取名s1K。

这个数据集看着小,含金量却极高。

团队从16个不同来源,收集了近6万个问题,涵盖数学、量子力学、脑筋急转弯等50个领域,然后严格按照难度、多样性、质量三个标准,一点点筛选,最后只留下1000个推理链路长、难度高的问题,每个问题都配上了详细的推理过程和答案。

其次,他们开发了一种“预算强制”技术,用来控制模型的思考时间。

简单说,就是给模型设定一个思考上限,要是模型思考太久,就强制它停止,进入答题阶段;要是思考时间不够,就提醒它再想想,这样既能保证推理质量,又能节省算力成本。

最后,在算力使用上,他们只用了16个英伟达H100 GPU,训练时间仅26分钟。

按照当时的GPU租金计算,这部分成本不到50美元。

要知道,很多顶级AI模型的训练,动辄需要上百个GPU,训练几天甚至几周,成本早就突破百万美元。

真相拆解

有人说李飞飞团队“作弊”,50美元根本不可能复刻Deepseek,这里要把话说透,避免大家误解。

这50美元,只包含了模型微调时的GPU租金,并没有包含通义千问Qwen模型本身的训练成本。

通义千问模型的训练,之前已经投入了大量的资金和人力,李飞飞团队是在这个成熟模型的基础上做优化,相当于“捡现成”,节省了从零训练模型的巨额成本。

就像我们买了现成的食材,只需要简单烹饪,就能做出美味的饭菜,食材的成本并没有算在烹饪费里。

还有人说,s1-32B模型的性能,已经超越了Deepseek和OpenAI的o1模型,这也不准确。

实测显示,这个模型在竞赛数学问题上,比o1-preview高出27%,和Deepseek的R1、OpenAI的o1性能相当,但并没有超过“满血版”的o1和正式版的Deepseek-R1。

业内专家也坦言,李飞飞团队的核心贡献,不是“复刻”本身,而是找到了一种低成本提升模型性能的方法。

他们证明,高质量的小数据集,加上简单的技术优化,就能让普通模型的性能大幅提升,不用再盲目追求海量数据和高额算力。

行业震动

李飞飞团队的这个操作,直接给AI行业带来了巨大冲击。

之前,AI行业一直是资本密集型领域,各大科技公司疯狂砸钱,比拼算力和数据,小团队根本没有立足之地。

现在,李飞飞团队用实际行动证明,没钱也能做顶级AI。

随着s1模型的开源,越来越多的团队开始效仿这种方法,基于开源模型做微调,节省成本。

据统计,通义千问的衍生模型数量已经突破9万,仅两款视觉模型的全球下载量就超过3200万次,开源大模型的生态越来越成熟。

各大科技公司也开始调整策略,不再一味砸钱,而是转向提升效率。

百度创始人李彦宏就曾说,AI推理成本每年下降90%,远超摩尔定律,未来AI会越来越普及。

谷歌CEO也表示,过去18个月,AI处理数据的成本下降了97%,智能会变得越来越容易获取。

对普通人来说,这不是遥不可及的科技新闻,而是和我们息息相关的变化。

未来,低成本AI会走进更多行业,比如医疗、教育、自动驾驶,降低这些领域的门槛,让我们的生活变得更便捷。

李飞飞作为华裔院士,能在AI领域做出这样的突破,也让很多华人感到自豪。

她没有靠资本堆砌,而是靠技术创新,打破了行业垄断,让AI回归技术本身。

后续,随着更多人借鉴这种方法,AI行业会迎来更激烈的竞争,而最终受益的,还是我们普通人。

信源:

展开阅读全文

更新时间:2026-03-24

标签:科技   美国   华裔   院士   性能   李飞飞   模型   团队   成本   数据   行业   美元   领域

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302034903号

Top