国产大模型距GPT3.5还有多远?方舟助力可能发生的第四次工业革命

近代人类科技发展有两个bug级别的东西,其中一个是当年的土星五号火箭,居然比几十年后现在的任何一枚火箭的运载能力都强大许多倍,强大到美国自己都再也无法复制土星五号,只能重新想办法登月:

第二个是ChatGPT的4.0版本,直接让人工智能强到不可思议的级别了,几乎所有厂商面对4.0只能暂时忽略它,只能将目标定义为努力追赶ChatGPT 3.5,那么中国的大语言模型什么时候能够追上?我的答案是,很快就能够做到!

错过了三次工业革命,中国不能再错过第四次了

想必每个人都知道工业革命是什么意思,它是人类生产力的飞速发展,直接影响到了整个人类的进程,也是西方国家从一个落后的偏远地区直接变成世界强国的根本原因之一。而三次工业革命分别是蒸汽机,内燃机和电力,计算机和互联网,我们稍微对比一下就会发现,这三次之所以被称为工业革命,其实就是大幅度的提高了人类的生产效率,让工作变得更快,每一个人所做的工作经过三次革命几乎可以相当于以前一个工厂的人所做的事情了。

而因为历史的原因,我们没有能够赶上前面的几次工业革命,一直是在奔跑着追上去的状态,而这一次,ChatGPT可能引起的工业革命我们并没有落后多少,而且很可能能够反超过去,让中国成为下一次工业革命的引领者。要知道工业革命是不可抗拒的,只能接受,当年蒸汽纺织机诞生,一台机器几个人可以做到以前上百个人纺纱织布数据,引起当时的恐慌,还砸毁工厂,然而后面还是取代了人力,而现在的人工智能,只需要几秒钟思考就可以完成大量人类整理很久的工作,这样的革命我们当然要赶上去。

而且现在的中国和过去的中国完全不同,我们有充足的技术储备,硬件条件可以做好这件事情,所以国产大模型也开始了爆炸式的出现和更新,因为我们知道,这场革命很可能是属于中国企业的。

距离GPT3.5还差多远?

2023年5月,科技部下属的中国科学技术信息研究所发布了《中国人工智能大模型地图研究报告》。该报告显示,截至5月28日,国内10亿级参数规模以上基础大模型至少已发布79个。这个数据可以看出国产大数据模型的蓬勃发展,虽然多不一定代表先进,但这么多的数据模型同时发展,一定能够诞生出非常优秀的,甚至世界第一的大数据模型的。而且,目前看来,很多国产大模型的性能已经接近或超越了GPT 3.5。这并不是我故意吹嘘,而是事实。

比如在规模上,GPT 3.5一共有1750亿个参数,而目前,国产大模型中最大的规模是清华大学发布的Wu Dao 2.0,宣称是全球首个万亿参数级别的预训练模型,超过了GPT-3.5但是Wu Dao 2.0还没有公开发布,也没有公开评测结果,因此还不能确定其真实的性能和效果。而其他国产大模型的规模距离GPT-3.5还有一定的差距。

但在性能上,国产大模型已经接近或超越了GPT3.5的水平。例如,在GLUE这个自然语言理解的综合评测平台上,华为的盘古-α得分为90.6,超过了GPT-3.5得分为90.0;在WebNLG这个自然语言生成的综合评测平台上,百度的文心一言得分为0.77,超过了GPT-3.5得分为0.75。

我们甚至可以看到一个具体的实例,近期看了一个由火山引擎、智谱AI和华泰证券高层共同参与的行业访谈,火山引擎总裁谭待提到了国产大模型追赶GPT三个阶段,并表示北京智谱华章科技开发的大语言模型ChatGLM2模型,大概可以达到GPT3.5,80%的水平,而且这个结论是真正让两个模型处理相同问题或指令集的,并由人工盲测打分来进行客观对比的,所以这个模型确实已经是比较接近3.5的水平了,而且很可能在年底之前就能够达到甚至超越。

但是,中国真的需要79个这么多的通用大数据模型吗?个人觉得并不需要,未来的大数据模型很可能是1-2个超强通用大模型+N个行业小模型的结构,这可能才是人工智能的正确发展之路。

我们需要什么样的大语言模型?

现在拿起一个大模型就让它写诗,写文章,写总结,但这些基本都是玩一会儿就失去兴趣了,我们不需要它们来写诗,而是希望它们能够解决实际的问题,帮助我们提高生产效率,降低生产成本,如同火山引擎总裁谭待说的一样:通用大模型,就像一个拥有20个博士学位的牛人。但是你让牛人做事,成本也高啊。所以,我可能不需要每次有问题,都要跑去问一个有20个博士头衔的人。有的问题,我只要找一个“专业"的博士就可以了。这样,成本相对就会降低很多。未来,我们的大数据模型应该是有无数的专业小模型存在于我国的各个行业才对。例如,医疗行业的大模型会医术,不需要会画画;金融行业的大模型能够处理经济数据,不需要预测天气。

比如,华泰证券公司,他们想要训练专用的模型,因为他们经常需要对某个行业或具体公司进行研究。过程中,就需要调研大量的资料和图表。然后,基于判断,生成一份,有助于大量投资者,准确理解市场,理解行业的报告。然而,生成这份报告的时候,有大量的工作是文案工作。这就让很多特别优秀的研究员,把大量时间花在对齐模板,和做一些机械的整理工作上。而现在,他们计划,喂给大模型非常优秀的历史研报,让它理解优秀研报的撰写模式和语言风格,自动完成模板生产。然后,基于公司财报、行业资讯等信息,再结合之前的模板,自动生成研究报告,再让研究员发挥聪明才智,进行判断和结论。可以节约大量的时间和人力成本。

所以想象一下,如果未来有大量的这种行业模型,存在于我们每一个企业,每一个行业,我们的社会发展会有多快?当然这并不容易达到,因为小模型优势是专用成本低,但缺点也是专用,没法用别人的,只能自己弄,但每一个行业或者公司都自己做一个大模型出来吗?绝对是不可能的,所以只有一种办法,那就是使用现成的基座模型进行训练。

云计算可能是未来的主流

大模型,每一次重新训练,都要动用上千张像英伟达的A100/A800一类显卡,然后花几个月的时间。持续优化,也基本需要一样多的显卡,持续数周的时间。所以一次就可能要花上将近千万元来购买显卡,而且这还没有算电费。所以根本不是普通行业和公司能够承受的,而且每个行业都去自己训练,其实就是一种浪费,所以云服务商火山引擎这一次走了一条非常正确的路,那就是搭建一个公共的大模型服务平台,模型商可以入住,比如现在百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等都已经接入这个平台了,后续还会有更多的大模型公司接入这个平台。

而这个平台的作用之一就是可以提供公共的算力,你不需要自己去买那么多的显卡,花费那么多的电费,你只需要使用这个平台就可以了,可以更简单地训练专属于自己行业需求的专用大模型,帮助每个行业,每个企业进入人工智能时代。

其次一个公司想要用大模型解决自己的问题,但是面对那么多的大模型,你知道应该选择哪种吗?哪个是适合你的?哪个的成本是最低的?很难找到,而火山方舟这个大模型服务平台,你可以将你的问题发给多个大数据模型,让它们进行推理,你可以从结果中找出最适合自己的那一个,然后再进行深入训练,这样才能够让未来千万专业模型落地到每个角度成为可能。

另外这个平台首创了安全互信机制,能够让大模型厂商不怕自己技术外泄,让使用模型的公司不担心自己的机密数据被获取,所有的数据都是在相互监督的情况下进行脱敏、加密运算和呈现结果的。

未来在我们手中

我非常期待,未来在火山方舟的帮助下,我们中国的每一个行业,每一个公司都能够拥有属于自己的专属大模型,帮助处理问题,未来,到医院机器可以快速帮你检查身体不用排队,到银行机器可以直接办完所有的业务不怕出问题,在家里AI可以辅导你的作业,回答你提出的任何学业上的问题,这样的未来才是中国的未来,我相信,这个模式也才是正确的发展模式,让第四次工业革命在中国发生!#国产大模型有望年底追上GPT3.5#

展开阅读全文

页面更新:2024-02-27

标签:方舟   工业革命   模型   人工智能   助力   中国   火山   显卡   人类   未来   数据模型   数据   行业   工作   平台   公司

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top