面对AI芯片,我们缺少一颗平常心

一颗含光800,吸引了2019云栖大会一半的注意力。

推理性能强劲,研发周期短,表现远超“友商”,媒体们毫不吝啬的溢美之词。

事实上,如此这般的情形每隔一段时间就会上演,就像在谈论 “全球最强AI芯片”的时候,已然充斥着各种“吹捧”的论调,少了份实事求是的平常心,也不愿更深一步的探讨。

面对AI芯片,我们缺少一颗平常心

01

作为AI和芯片两大领域的交叉点,AI芯片早已成为资本青睐的赛道,就连以往谈半导体色变的VC,对芯片产业的热情也彻底被AI引燃,相继诞生了多家扎根于AI芯片的独角兽,即便尚未拿出任何量产的产品。

那么,什么是AI芯片?这个问题并不难回答。

广义上说,人工智能主要由数据、算法和算力构成,其中算力的来源就是芯片,只要是能够运行人工智能算法的芯片,都可以称之为AI芯片。除了GPU、FPGA、ASIC为代表的AI加速芯片,还有类脑芯片、可重构通用AI芯片等等。

学究一些的话,AI芯片还可以从两个维度进行分类:

一个是任务分配的维度,人工智能主要包括训练和推理两个环节。

前者通过大数据训练出一个复杂的神经网络模型,需要有一定的通用性,以便完成各种各样的学习任务;后者主要是借助已有的神经网络模型进行运算, 利用新的输入数据来一次性获得正确结论的过程。打个比方来说,想要让AI识别猫的照片,需要大量标记的数据进行训练,告诉AI这个就是猫,之后就可以建立相关的神经网络模型。推理的过程就是输入一张照片,让AI得出是不是猫的结论。

简单来说,训练芯片对芯片的性能和精度要求非常高,而推理芯片要解决的是对简单指定的重复计算和低延迟的要求。

另一个应用场景的维度,人工智能芯片应用于云端还是终端。

结合推理和训练的任务分配,在应用场景层面可以分为三类:

一是云端训练,由于深度学习的训练阶段需要大量的数据和运算,单一处理器无法独立完成,往往只能在云端实现;二是云端推理,单位功耗算力、时延、成本等都是衡量云端推理芯片的因素,并且出现了GPU、FPGA、ASIC等多种技术路线;三是终端推理,包括智能手机、智能硬件、汽车、摄像头等等,并且需求差异化很大,比如虚拟现实对实时性的高要求,推理环节难以在云端实现,要求终端有独立的推理计算能力。

归纳而言,云端芯片的特点是性能强大,可以支持图片、语音、视频等不同应用,终端芯片强调体积和能耗,通常只支持一两种AI能力。

人工智能作为互联网的下一幕,AI芯片无疑是最重要的基础设施,市场前景毋庸置疑。况且AI芯片从架构到应用,与传统处理器和算法存在不小的差异,哪怕是缺少基础的中国芯片产业,也不乏从中分一杯羹的机会。

中国企业选择AI芯片作为发力点,也就不难理解。

02

理解了什么是AI芯片,再来打量含光800,或许会有不一样的视角。

就定义上来看,含光800是一颗AI云端推理芯片,如果仔细看了前面的内容,不难理解含光800的应用场景。

作为平头哥的首款自研芯片,阿里在含光800这颗芯片上着实进行了大量投入。比如在硬件上采用了自主研发的芯片架构,有能力堆更多的晶体管,同时减低了 I/O 需求和数据的搬移,有效解决了性能瓶颈问题;软件层面针对CNN及视觉类算法深度优化计算、存储密度,提高了图像识别的能力。

面对AI芯片,我们缺少一颗平常心

那么,软硬件协同创新的含光800是否走到了芯片领域的金字塔顶端,又是否预示着中国芯片产业已经抹平了差距?还需要一些横向的比较。

首先,阿里在数据对比上耍了一点儿“小心机”。

含光800对标的对象是Habana Goya、寒武纪MLU270等产品,不过含光800有高性能、低功耗和边缘三种模式,发布会上提到的78563 IPS是高性能模式的跑分,500IPS/W的能效比是低功耗模式的成绩。如果平行对比的话,含光800的能耗比仍然足够优秀,却也多多少少暴露了“不自信”的心理。

而从Habana Labs明年推出7nm的新一代推理芯片的消息来看,哪怕是在AI推理芯片领域,阿里仍然处于追赶而非远远将友商甩开的局面。

其次,含光800的应用场景以视觉场景为主。

正如前面所提到的,含光800在软硬件上针对CNN计算进行了优化,视觉场景将是重点应用的方向,发布会上引用拍立淘的例子也间接证明了这一点。也就是说,含光800可以满足人工智能的大部分应用场景,但仍然有着不小的局限性,比如在语音识别、自然语音处理等领域,可能还需要其他芯片来弥补算力上的不足。

言外之意,像阿里这样的中国云计算厂商,很长时间内还要依赖英伟达等芯片企业,尚未在算力上形成属于自己的护城河。

面对AI芯片,我们缺少一颗平常心

除此之外,含光800选择了和谷歌TPU相同的云端售卖方式,并没有直接成为英伟达、寒武纪、Habana Labs等友商的竞争对手。应该说这是一种比较聪明的策略,针对阿里云场景深度定制的芯片,在很大程度上压缩了商用化的时间,也规避了软件编译器、框架、工具链等方面的不足。

然而需要正视的是,无论是阿里在数据对比上的“田忌赛马”,还是服务模式上的特立独行,中国在AI芯片领域的迟到都是不争的事实。

谷歌在2016年就发布了自主研发的张量处理器TPU,Habana Goya的推出也有了一年的时间,而含光800刚刚完成流片成功到商用的过程,落地的时间要到年底前后。要知道流片成功只说明数理逻辑没有出错,芯片的最终效能如何,还需要设计周边的一堆系统,阿里注定还有很长的路要走。

03

归根结底,中国芯片产业的欠缺不仅在技术上,也体现在思维理念上。

半导体和互联网行业有着本质上的差异。互联网上商业模式的创新可能比技术更见效,不乏一些烧钱培养用户习惯的案例。但在半导体领域,却是一个深耕技术的漫长过程,需要持续多年的资金投入和基础研发,而且可能很多年中都赚不到钱。

从含光800发布后的媒体表现来看,照旧从互联网的标准丈量阿里的芯片事业,以一种本位思维去理解。倘若仅仅是媒体层面的自嗨还无伤大雅,恐怖的是仍然有企业靠互联网思维去打磨芯片,比如借着含光800的热度,一些创业者开始疯炒AI芯片的概念,看似带动了一波芯片概念股的高涨,最后留下的却是一地鸡毛。

不禁想要为这样的行为“泼一盆冷水”,Habana Labs就是一个活生生的例子。

这家成立于2016年的以色列初创企业,在成立两年左右的时间里即推出了名为Goya 的人工智能推理芯片,并且在ResNet-50测试中,以四倍于英伟达 Tesla T4 的处理性能、两倍的能耗比、仅仅 1.01ms 的处理延迟刷新了世界记录。而在今年6月份,Habana Labs又发布了名为Gaudi 的人工智能训练芯片,处理能力达到英伟达 Tesla V100 的 3.8 倍,已然领先于大多数中国企业。

令人不解的是,手握两款AI芯片的Habana Labs在去年11月份的B轮融资中,仅仅拿到了英特尔7500 万美元的投资,与国内那些动辄数亿美金融资的AI独角兽相比,不免有些相形见绌。

问题出在了哪?可能是在“缺芯”的痛点下,我们已经习惯性做出一些应激反应,看待事物的态度出现了偏差,过度放大解读就是最直接的例子。就像阿里的含光800,仅仅是在云端推理芯片上赶上了全球不乏,本质目的在于避免过多依赖英特尔、英伟达等芯片巨头,防守的态势远大于进攻。或许还没有到过度渲染“吊打友商”、“全球最强”、“绝对领先”等夸张性字眼的时候。

所幸,在媒体不遗余力吹捧的时候,阿里云的CEO行癫对芯片还有着理性的认知:“含光800的发布只是万里长征第一步。”作为吃瓜群众也要回归一颗平常心,赞赏创新的同时,也需要正视差距和不足,切莫将“疯狂”变成了捧杀。

展开阅读全文

页面更新:2024-03-12

标签:芯片   英特尔   英伟   神经网络   维度   阿里   终端   人工智能   平常心   云端   中国   算法   场景   性能   领域   数据   数码

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top