面对AI芯片，我们缺少一颗平常心

一颗含光800，吸引了2019云栖大会一半的注意力。

推理性能强劲，研发周期短，表现远超“友商”，媒体们毫不吝啬的溢美之词。

事实上，如此这般的情形每隔一段时间就会上演，就像在谈论 “全球最强AI芯片”的时候，已然充斥着各种“吹捧”的论调，少了份实事求是的平常心，也不愿更深一步的探讨。

作为AI和芯片两大领域的交叉点，AI芯片早已成为资本青睐的赛道，就连以往谈半导体色变的VC，对芯片产业的热情也彻底被AI引燃，相继诞生了多家扎根于AI芯片的独角兽，即便尚未拿出任何量产的产品。

那么，什么是AI芯片？这个问题并不难回答。

广义上说，人工智能主要由数据、算法和算力构成，其中算力的来源就是芯片，只要是能够运行人工智能算法的芯片，都可以称之为AI芯片。除了GPU、FPGA、ASIC为代表的AI加速芯片，还有类脑芯片、可重构通用AI芯片等等。

学究一些的话，AI芯片还可以从两个维度进行分类：

一个是任务分配的维度，人工智能主要包括训练和推理两个环节。

前者通过大数据训练出一个复杂的神经网络模型，需要有一定的通用性，以便完成各种各样的学习任务；后者主要是借助已有的神经网络模型进行运算，利用新的输入数据来一次性获得正确结论的过程。打个比方来说，想要让AI识别猫的照片，需要大量标记的数据进行训练，告诉AI这个就是猫，之后就可以建立相关的神经网络模型。推理的过程就是输入一张照片，让AI得出是不是猫的结论。

简单来说，训练芯片对芯片的性能和精度要求非常高，而推理芯片要解决的是对简单指定的重复计算和低延迟的要求。

另一个应用场景的维度，人工智能芯片应用于云端还是终端。

结合推理和训练的任务分配，在应用场景层面可以分为三类：

一是云端训练，由于深度学习的训练阶段需要大量的数据和运算，单一处理器无法独立完成，往往只能在云端实现；二是云端推理，单位功耗算力、时延、成本等都是衡量云端推理芯片的因素，并且出现了GPU、FPGA、ASIC等多种技术路线；三是终端推理，包括智能手机、智能硬件、汽车、摄像头等等，并且需求差异化很大，比如虚拟现实对实时性的高要求，推理环节难以在云端实现，要求终端有独立的推理计算能力。

归纳而言，云端芯片的特点是性能强大，可以支持图片、语音、视频等不同应用，终端芯片强调体积和能耗，通常只支持一两种AI能力。

人工智能作为互联网的下一幕，AI芯片无疑是最重要的基础设施，市场前景毋庸置疑。况且AI芯片从架构到应用，与传统处理器和算法存在不小的差异，哪怕是缺少基础的中国芯片产业，也不乏从中分一杯羹的机会。

中国企业选择AI芯片作为发力点，也就不难理解。

理解了什么是AI芯片，再来打量含光800，或许会有不一样的视角。

就定义上来看，含光800是一颗AI云端推理芯片，如果仔细看了前面的内容，不难理解含光800的应用场景。

作为平头哥的首款自研芯片，阿里在含光800这颗芯片上着实进行了大量投入。比如在硬件上采用了自主研发的芯片架构，有能力堆更多的晶体管，同时减低了 I/O 需求和数据的搬移，有效解决了性能瓶颈问题；软件层面针对CNN及视觉类算法深度优化计算、存储密度，提高了图像识别的能力。

那么，软硬件协同创新的含光800是否走到了芯片领域的金字塔顶端，又是否预示着中国芯片产业已经抹平了差距？还需要一些横向的比较。

首先，阿里在数据对比上耍了一点儿“小心机”。

含光800对标的对象是Habana Goya、寒武纪MLU270等产品，不过含光800有高性能、低功耗和边缘三种模式，发布会上提到的78563 IPS是高性能模式的跑分，500IPS/W的能效比是低功耗模式的成绩。如果平行对比的话，含光800的能耗比仍然足够优秀，却也多多少少暴露了“不自信”的心理。

而从Habana Labs明年推出7nm的新一代推理芯片的消息来看，哪怕是在AI推理芯片领域，阿里仍然处于追赶而非远远将友商甩开的局面。

其次，含光800的应用场景以视觉场景为主。

正如前面所提到的，含光800在软硬件上针对CNN计算进行了优化，视觉场景将是重点应用的方向，发布会上引用拍立淘的例子也间接证明了这一点。也就是说，含光800可以满足人工智能的大部分应用场景，但仍然有着不小的局限性，比如在语音识别、自然语音处理等领域，可能还需要其他芯片来弥补算力上的不足。

言外之意，像阿里这样的中国云计算厂商，很长时间内还要依赖英伟达等芯片企业，尚未在算力上形成属于自己的护城河。

除此之外，含光800选择了和谷歌TPU相同的云端售卖方式，并没有直接成为英伟达、寒武纪、Habana Labs等友商的竞争对手。应该说这是一种比较聪明的策略，针对阿里云场景深度定制的芯片，在很大程度上压缩了商用化的时间，也规避了软件编译器、框架、工具链等方面的不足。

然而需要正视的是，无论是阿里在数据对比上的“田忌赛马”，还是服务模式上的特立独行，中国在AI芯片领域的迟到都是不争的事实。

谷歌在2016年就发布了自主研发的张量处理器TPU，Habana Goya的推出也有了一年的时间，而含光800刚刚完成流片成功到商用的过程，落地的时间要到年底前后。要知道流片成功只说明数理逻辑没有出错，芯片的最终效能如何，还需要设计周边的一堆系统，阿里注定还有很长的路要走。

归根结底，中国芯片产业的欠缺不仅在技术上，也体现在思维理念上。

半导体和互联网行业有着本质上的差异。互联网上商业模式的创新可能比技术更见效，不乏一些烧钱培养用户习惯的案例。但在半导体领域，却是一个深耕技术的漫长过程，需要持续多年的资金投入和基础研发，而且可能很多年中都赚不到钱。

从含光800发布后的媒体表现来看，照旧从互联网的标准丈量阿里的芯片事业，以一种本位思维去理解。倘若仅仅是媒体层面的自嗨还无伤大雅，恐怖的是仍然有企业靠互联网思维去打磨芯片，比如借着含光800的热度，一些创业者开始疯炒AI芯片的概念，看似带动了一波芯片概念股的高涨，最后留下的却是一地鸡毛。

不禁想要为这样的行为“泼一盆冷水”，Habana Labs就是一个活生生的例子。

这家成立于2016年的以色列初创企业，在成立两年左右的时间里即推出了名为Goya 的人工智能推理芯片，并且在ResNet-50测试中，以四倍于英伟达 Tesla T4 的处理性能、两倍的能耗比、仅仅 1.01ms 的处理延迟刷新了世界记录。而在今年6月份，Habana Labs又发布了名为Gaudi 的人工智能训练芯片，处理能力达到英伟达 Tesla V100 的 3.8 倍，已然领先于大多数中国企业。

令人不解的是，手握两款AI芯片的Habana Labs在去年11月份的B轮融资中，仅仅拿到了英特尔7500 万美元的投资，与国内那些动辄数亿美金融资的AI独角兽相比，不免有些相形见绌。

问题出在了哪？可能是在“缺芯”的痛点下，我们已经习惯性做出一些应激反应，看待事物的态度出现了偏差，过度放大解读就是最直接的例子。就像阿里的含光800，仅仅是在云端推理芯片上赶上了全球不乏，本质目的在于避免过多依赖英特尔、英伟达等芯片巨头，防守的态势远大于进攻。或许还没有到过度渲染“吊打友商”、“全球最强”、“绝对领先”等夸张性字眼的时候。

所幸，在媒体不遗余力吹捧的时候，阿里云的CEO行癫对芯片还有着理性的认知：“含光800的发布只是万里长征第一步。”作为吃瓜群众也要回归一颗平常心，赞赏创新的同时，也需要正视差距和不足，切莫将“疯狂”变成了捧杀。

展开阅读全文

页面更新：2024-03-12

标签：芯片英特尔英伟神经网络维度阿里终端人工智能平常心云端中国算法场景性能领域数据数码

1 2 3 4 5

面对AI芯片，我们缺少一颗平常心

轻松一碰传华为智慧屏让投屏仅需一碰

四层散热+线性马达！小米9 Pro这次够Pro，恐怕价格也要Pro了

彬彬有理 | 自带改装风+四缸，威朗pro gs或能强势回归

00后买车众生相：颜值、智能、按揭缺一不可

不拼续航拼大脑，威马W6能否成功突围

WEY摩卡上市售价17.58万起，钢琴大师李云迪成为摩卡车主

初恋一战成名，赤兔能否完美复制？

彬彬有理 | 高端现代“下凡”，能否梅开二度？

14.8-18.8万元，SUV颠覆者吉利星越L开启全球预售

实至名归！传祺GS4荣膺C-NCAP碰撞测试五星安全认证

4月轿车销量榜 | 奔驰C重夺第一，帝豪成自主轿车独苗苗

WEY摩卡，能否打响新一代智能汽车第一枪？

玩综艺直播，秀活力新潮长安UNI-T运动版正式上市

吴宣仪现场入职哈弗赤兔520惊喜上市指导价10.98—12.38万元

选磷酸铁锂还是三元锂？广汽埃安弹匣电池：我全都要

直线加速仅慢RC-F一秒，威兰达高性能版成最快国产丰田车

比亚迪：中国首家完成一百万新能源乘用车下线的车企

小米29号发布会重磅技术接踵而至，除了MIX新机还有澎湃

胡润中国十强消费电子榜，华米OV占领TOP4，彼此差距也很大

用户出行碳减排贡献值将获官方认证，首个碳减排方法学算

GL8的价格，埃尔法的享受，这款中国MPV很给力

不仅手机和电视！联发科芯片在智能音箱和TWS市场一样表

顶级屏幕+顶级性能+定制三星GN2，小米11U售价恐超八千

小米电视ES 2022款成市场新宠，联发科MT9638芯片提供强

这款中国豪华MPV登场后，豪华标杆不再是合资说了算