特斯拉Dojo入场,新一轮算力大战一触即发

张孝荣

7月6日,在2023世界人工智能大会上,特斯拉首席执行官马斯克预测说,大概今年能够实现全自动驾驶。

马斯克为什么放言预测今年实现全自动驾驶?原因在于特斯拉定制超级计算机平台Dojo产品的进展,使其算力飙涨。

特斯拉凭自研芯片和Dojo,算力很快进入一个爆发期,加上几十万用户实测数据训练,汽车的AI性能随之迭代提升,特斯拉FSD或将逼近5级,从而对其他品牌电动车形成AI威胁。这意味着全球电动车竞争将进入新阶段。

如今,马斯克手里有算力、有数据、有AI模型,国产品牌如何越过这堵新的AI技术墙?新一轮算力大战恐怕在所难免。

特斯拉大幅提升AI能力

Dojo是特斯拉自研的超级计算机。近日,特斯拉AI团队在推特上发布了特斯拉定制超级计算机平台Dojo的产品进展时间线,表示该计算机于2023年7月投入生产;到2024年2月,Dojo将成为全球最先进的5台超级计算机之一;到2024年10月,Dojo总算力规模将达到100Exa-Flops。

100Exa的浮点算力,相当于30万块英伟达A100 GPU的算力总和。若以英伟达A100市面价格约1万美元计算,那么明年底将与Dojo总价相当。Dojo既然是自研的超级计算机,成本可能会低于30亿美元,定价必然会低一些,即便如此,这价值也大大超出了许多大型超算的投资。

Dojo意为“道场”,来源于日语的柔道训练场。通过Dojo训练深度神经网络,特斯拉AI智力水平将会得到逐步提升。

特斯拉首先通过采购英伟达GPU组成的大型超级计算机,来训练AI,这台超算包含5760块英伟达A100 GPU,安装在总计720个节点当中,每节点含8个GPU,其性能达到1.8 Exa-Flops,成为当时世界上速度最快的超级计算机之一。

但时间一长,他们发现GPU在处理速度和软件上有点力不从心。于是,马斯克决定干脆自主设计一个芯片,自行开发超算,那年是2020年。

自研高性能AI型CPU

Dojo拥有专门设计的AI型CPU,性价比优于GPU。

传统的电脑CPU,不能解决AI计算问题,由于内核数量有限,处理AI任务很慢,效率极低。因此,电脑要想处理AI任务,就需要在主板上再插一张AI卡,比如英伟达的GPU,这种GPU有成千上万的核心,可以同时并行处理大量的计算任务。

D1是一种面向AI的新型CPU,具有354内核,运行频率为2GHz。据设计师介绍,D1自研架构基于RISC-V架构ISA,从RISC-V借鉴了一些指令,专门针对运行机器学习和神经网络训练进行了优化,采用7nm制程工艺,具备超过500亿个晶体管,形成了354个核心,支持多种浮点格式,包括FP32、BFP16和一种新的格式CFP8或可配置的FP8,其32位浮点运算的最大性能是22.6T-FLOPs,对于16位浮点计算,D1的最大性能跃升至362T-FLOPs。

D1每个核心都具有完整的带矩阵计算能力,其计算灵活性是远超众核架构的GPU。D1芯片面积为645平方毫米,小于英伟达的A100(826平方毫米)和AMD Arcturus(750平方毫米)。

据特斯拉芯片团队称,同成本下性能提升4倍,同能耗下性能提高1.3倍,占用空间节省5倍。

Dojo算力无上限。

D1带来的不仅是性价比的提升,还有架构的改进。

这里有个有意思的细节。从特斯拉公布的产品进度线来看,Dojo这台超级计算机的算力不是一蹴而就,而是逐年累加,随着时间线拉长,算力可能爆棚,这也是特斯拉Dojo的创新之处。注意,这里的算力源于超算,不是那种勉强拼凑起来的云计算。

为什么如此独特?原因在于Dojo采用了分布式架构,可以随意地增加算力。这与我们熟悉的五百强超算系统不同,Dojo是一套完全可定制架构,全面涵盖计算、网络、输入/输出(I/O)芯片,乃至指令集架构(ISA)、供电、封装和冷却。据特斯拉介绍,用D1扩展算力的方式就好像自家地面铺瓷砖一样。

特斯拉将25个D1芯片按5×5规格组成一个训练模块,这被称为tile(瓷砖),再将120个训练模块组成一个Dojo ExaPod。

换言之,每个Dojo ExaPod内置3000个D1芯片,拥有超过100万个核心,总算力达到1.1E-FLOPS(每秒百亿亿次浮点运算)。

由于Dojo是大型分布式系统,从理论上来说,Dojo的性能拓展可以无限扩张,没有上限。例如,2023年Dojo部署一台Dojo ExaPod,2024年底将有100台Dojo ExaPod,而2025年,或许可以部署500台乃至1000台……随着Dojo算力猛涨,采用其他芯片的超算,或许望尘莫及。

为何需要算力可增长的超级计算机

算力大幅增长的原因,是特斯拉汽车增长很快。特斯拉在2021年交付了94万辆电动汽车,在2022年预计交付了131万辆,并且在2023年3月宣布了其总产量达到了400万辆。

特斯拉的目标是到2030年实现年产2000万辆电动汽车,这意味着要在10年内将产量增长了20倍。特斯拉的快速增长,意味着算力的需求也随之出现爆炸式增长。

早前在回答为什么要自研超算Dojo时,马斯克曾表示:“解决自动驾驶的唯一方法是解决现实世界中的AI问题,无论是硬件还是软件,而这也是特斯拉正在做的事情。除非一家公司具有很强的AI能力以及超强算力,否则很难解决自动驾驶难题。”

特斯拉Dojo可以做什么任务呢?可以概括为三点。

一是训练神经网络。特斯拉的多模态神经网络在客户车辆中投入使用,这些网络可以接受任意模式的数据,如摄像头视频、地图、导航、IMU (惯性测量单元) 、GPS等。

二是3D重建。特斯拉的计算机已经可以熟练地进行类似于预测障碍物的任务,即可以简单预测某个3D位置被占据的可能性,这种预测可以让汽车避免碰撞。

三是自动标注。特斯拉展示过基于车队数据而构建的多个不同场景下的驾驶训练,包括夜间、隧道、小巷、田野、高速以及多种不同障碍物的情况。Dojo能够处理海量的视频数据,特斯拉还建立了一个1000人规模的数据标注团队,结合人工的细腻与机器的高效,对物体信息进行标注。同时特斯拉还开发了仿真场景技术,模拟现实中不常见的“边缘场景”,来提升神经网络的培训效率。

无论是多模态神经网络、自动标注技术、还是基于车队数据的场景三维重建,这些技术都是为了让特斯拉汽车更好地适应复杂的现实环境。而这一切技术的实现需要庞大的算力支持,这也是特斯拉Dojo的使命所在。

技术挑战

Dojo建了一个围墙。墙内的是高AI车,墙外的是低AI车。这面墙给国产车厂带来的压力,不仅仅是技术路线的差距,还直接带来了生存竞争的威胁。

国产新能源车自动驾驶水平停留在L3以下迟迟难有突破,特斯拉已经瞄准L4&L5。

2022年10月,全球有16万多名特斯拉车主在参与FSD beta,据了解今年已经有40万人,为特斯拉收集真实世界中的驾驶数据。而Dojo exapod将利用这些数据构建起新的模型,向这些用户不断推送系统更新,由此形成良性循环。今年5月,有一位特斯拉车主上传视频,使用FSD从旧金山到好莱坞,6小时全程无接管。这些用户测试数据对FSD贡献巨大,可以进一步推动开发加速,从而跟竞争对手拉开差距。当然,FSD不是万能的,测试事故也不少,但与其他车厂相比,优势在于可以用40万车辆的实地运行数据来训练AI。

2023年6月9日,马斯克在微博发文表示:“我们很乐意将Autopilot(自动辅助驾驶)/FSD(完全自动驾驶能力),或其他特斯拉技术授权给有需要的公司。”显然,此举可以弥补一些车厂“少魂”的遗憾,可能会给一些车厂带来福音,也可能给那些自己设计“车魂”的头部企业带来的生存威胁。

国内会不会引入FSD?这是个悬念。

前一段时间,马斯克开启了3年以来的首次中国行,就新能源汽车和智能网联汽车发展等议题,与相关部门进行了深入交流。随后“上海将作为FSD完全版第一个试点城市开放”的消息在网上盛传,特斯拉FSD进入中国虽时间未定,但趋势愈发明确。

特斯拉FSD如果在国内落地,那么需要在中国建立类似于Dojo的超算中心,在中国本地进行模型训练。

马斯克还说过,最终会将Dojo超算提供给希望使用它来训练神经网络的其他公司,这意味着,特斯拉有可能将AI能力输出给其他车厂。

Dojo超算能力是否会输出?FSD是否会授权?暂时,这都是悬念。

算力大战

算力意味着AI水平。当市场内卷白热化产品日益同质化出现时,从产业价值链上寻找技术制高点并最终达到差异化竞争,就会成为必然选择。从这个角度出发,汽车的AI算力将会成为继芯片、三电、充电基建之后的兵家必争之地。

国内已经有部分新能源车企敏锐地注意到了Dojo的战略价值,正在积极投入资源打造类似设备。据相关媒体报道,长城、吉利、小鹏和理想汽车都开始了超算中心建设。随着Dojo投产,新一轮AI算力大战将会徐徐拉开大幕。

我国新能源车龙头企业应高度重视Dojo的战略作用,正视Dojo对自动驾驶的巨大提升作用,并积极跟进投入自动驾驶技术研发,避免在未来竞争中处于不利地位。

那么算力如何突围?D1证明最好的办法绝不是高价抢购囤积GPU。那么连“价格战”都不敢参与的企业,还能打得起“算力战”吗?

作者简介

张孝荣,深度科技研究院院长。

END

编辑:艾丽

审核:赵涵

政审:王军善

终审:朱永旗

展开阅读全文

页面更新:2024-05-22

标签:特斯拉   英伟   神经网络   浮点   架构   芯片   性能   计算机   数据   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top