旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

编辑:yaxin

【新智元导读】从深度学习算法、计算机视觉算法到AIoT算法,从开源框架旷视天元到AI生产力平台Brain++,旷视十年故事,旷视首席科学家、旷视研究院院长孙剑讲给你听。


万万没想到,我和小伙伴们被旷厂拿去「炼丹」了。


没错,就是这个炼丹炉!


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


OMG!真·颅内高潮...


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


业界认为「炼丹」过程正如算法研究过程


众所周知,AI的三大支柱分别是数据、算法、算力。


那么在炼丹过程中,数据便是金木水火土等自然元素,算法框架是用来炼丹的炉子,算力就是炼丹炉下的三昧真火。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


元素全不全,炉子好不好,火旺不旺决定了AI开发者能不能练出一颗AI的「灵丹妙药」。


从2014年至今,中国新一代炼丹宗师旷视经过多年的磨练打磨,打造了「炼丹房」—— Brain++


MegEngine(深度学习框架天元)是丹炉,MegData(数据管理平台)是元素,MegCompute(深度学习云计算平台)便是那三昧真火。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


这次,「炼丹房」 Brain++ 迎来了全新升级!


升级后的炼丹房,「自动」成为最大特色,炼丹师们不再需要经过九九八十一天这么漫长的时间来炼制丹药。


这个平台提供了怎样的最新功能,让AI开发者们更轻便地生产算法?


Brain++「神助攻」:一个「旗帜检测」算法诞生


熟悉旷视的人都应该知道,Brain++ 是旷视在AI领域创业多年的致胜法宝。


它将算法、算力和数据能力集为一体,核心能力包括:


数据的处理、清洗和管理能力,算力的共享、调度和分布式能力,算法的训练、推理及部署能力。


全面覆盖了从 AI 生产(输出算法模型)到应用(实现算法工程化封装)各环节。


因此,Brain++被内部定义为「AI生产力平台」


但时局变了,数据满溢,算力飞升,算法无处不在。许多开发者们真正面临的挑战是:如何让算法生产更加高效?


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


要知道,算法生产能力决定算法价值上限。


当前的算法生产不仅仅是模型的训练,还包括需求分析、数据处理、上线部署、落地应用4个环节


过程标准化是影响算法生产的关键要素,只有过程标准化才能实现算法生产的自动化。


让算法生产迈向自动化时代,便是Brain++迎接这一挑战的底气!


自动化的数据管理和质检——自动推荐合适的训练算法和模型——自动检查算法准确率并给出优化建议便是升级后Brain++的最新功能。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


举个真实场景中的例子,


在钢铁冶炼厂中,存在一些比较危险的设备。根据生产安全的要求,这些设备周围需要插小红旗来做警示和标志。


如何能够检测出小红旗是否还插着?


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


这就需要做一个红旗检测的模型,通过安装的摄像头来进行自动化检查。


需求明确后就需要进行算法生产了。


首先,Brain++提供自动化的数据管理和质检,包含十余种质检策略,这个过程中可以排除无意义的数据。


下面这2个红旗就是通过自动化平台所发现,图片的画风其实和我们真实场景中的差别非常大,就属于一些无效数据,或者说噪音数据。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


平台自动检测出后,就会在训练模型前帮你剔除。


然后便开始模型自动化训练,平台会根据部署资源的要求,为开发者自动推荐最合适的训练算法和策略。


这一环节中,就不需要开发者自己去学习到底应该怎样去选择算法或者调优模型。


接下来便是算法调优分析,Brain++集成十余大类不同的结果分析和对应的调优策略,比如漏检/误检结果呈现。


当红旗检测模型训练完成后,将其放到实际应用场景中测试,黄色框就是一次训练后的算法检测出来红旗的位置。


说明这一算法存在明显误检问题,特别可能在这样的一个场景误检率比较高,AI生产力平台便可帮助开发者自动发现问题,并给出针对性优化建议。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


总的来看,当我们分析完想要做一个旗帜的检测需求之后,首先需要2个小时来做一个图像的质检和旗帜的标注,之后选择一个GPU的训练环境,模型训练的时间大概花费一个小时左右的时间。


在上线部署后,根据刚刚提到的分析和调优策略,研究人员进行了2轮左右的迭代,一个「旗帜检测」算法就诞生了!


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


你所感受到的便捷,是旷视通过总结过去10年算法生产落地的海量经验,探索出一套「快速、低成本生产算法」的模式,并将其沉淀在Brain++。


这十年,旷视AI创新走过怎样一个历程?


7月16日,由旷视首席科学家、研究院院长孙剑领衔的技术团队在2021旷视技术开放日(MegTech 2021)上分享了旷视十年来在AI技术上的实践和思考。


十年实践,首席科学家孙剑发AI「灵魂」三问


今年,是旷视成立的第十年。


我们来聊一聊旷视这十年的进阶之路。


首席科学家孙剑以旷视为例,总结了过去十年中国AI技术价值的发展历程。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


2011年前后,AI发展的重点是基础科研。基础科研的关键点是突破单点算法,让AI率先在互联网等数字化程度高等领域应用落地,变得真正可用。


2015年起,AI需求越来越多,AI商业化落地也越来越多。这个过程中,算法在不断拓展应用的边界,从算法到软硬结合,AI创造的价值越来越大。


从2020年开始,AI成为新基建的重要部分,持续降低算法门槛,让AI生产变得更加容易,基础设施需要AI普惠化。


AI有没有用?AI在哪里用?AI易不易用?


这是AI行业的「灵魂」三问,是所有AI企业需要回答的问题。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


孙剑认为,AI有没有用归根到底是看AI基础科研有没有突破。


基础科研是AI创新突破的基石,需要长期主义的坚持。


对旷视来说,要构建科学价值和产业价值统一的基础科研体系


十年来,旷视不断突破创新:


在学术上发表85篇顶级会议论文,在竞赛上斩获40项冠军,在实用上研发了包括ShuffleNets系列在内的众多基础模型,已经广泛应用在手机等智能设备上,推动软硬协同发展。


基础科研有了,落地才是科研的价值,这就需要解决「AI在哪里用」的问题。


对于旷视,一直瞄准的是消费物联网、城市物联网和供应链物联网三大场景


AI是核心能力,IoT是落地场景,在数字世界与物理世界融合的智能化时代,AI算法正在为产品带来更多的价值提升。


旷视认为,「算法不只让很多产品从好变更好,更能让产品从不可能变可能。」


在旷视十年的AI实践落地中发现,算法已不再仅仅是「软件物料」,而是成为「核心组件」


从科研到落地,算法正在创造越来越大的价值,也在开始重新定义软硬件。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

旷视研究员范浩强在MegTech 2021上的分享


AI落地是我们所有人都在讲的问题,但是当前,大量算法生产过程还是非标准化。因为非标准化所以算法生产过程充满不确定性。


旷视认为,落地实用是检验算法的最高标准之一,而生产落地实用算法的过程「只有先标准化才能自动化」,才能更进一步实现规模化的普惠易用。


从2014年至今,持续打磨升级的AI生产力平台Brain++,就是旷视推动算法生产迈向自动化时代的AI基础设施。


为什么是旷视?


不是炼丹「上瘾」,是AI进化


旷视是一家靠算法起家的公司。


准确来说,可以细分为两类


一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。


另一类则是行业算法 (或者称AIoT算法)。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。


MegTech 2021上,旷视展示了其算法量产星空图


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


算法量产不是一个单一产品,更不是「上瘾」,而是一种生产模式的理念革新和生产力进化


旷视现场通过一系列技术Demo演示,系统展示了其最新的技术成果。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


旷视研究院推出了面向服务器和下一代AI芯片的通用模型RepVGG,其在开源后Github star已超过1800。


还推出全景视频实时拼接算法


全景视频拼接的实现,需要多个摄像头在同一场景下采集不同方向视频,然后逐帧地将各个方向的视频帧拼接起来,最终得到360度全景视频,甚至360度*180度的球面全景视频。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


其核心是运用基于光流的多摄AI拼接算法,同时依靠实时动态无缝拼接网络模型,解决了多摄拼接计算量大、拼缝明显,以及拼接无法动态更新的技术难题。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


还有单目3D车路感知:仅用单目可见光相机,就可以实现车路信息的3D感知。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


旷视MegTech 2021上还展示了,目前性能最强的端到端实时全卷积全景分割算法,以及挑战经典,目标检测架构创新的YOLOF


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


从基础科研,到行业落地,再到基础设施,这是人工智能技术价值跃迁的三个关键。


旷视正是沿着这样的路线在不断创新,务实落地。预研一代、孵化一代、交付一代,这是旷视技术创新研发模式。


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问


在技术开放日现场,旷视将这一套创新研发模式首次对外完整的呈现出来。


孙剑总结道,「聚焦最优秀的人才,一起做最好的科研,通过产品让科研成果创造价值,不断探索新领域,这是旷视的秘诀,也是AI技术价值跃迁的秘诀。」


对了,忘了告诉你,这是一个北京新晋AI网红打卡圣地。


不要太燃~


旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

展开阅读全文

页面更新:2024-04-21

标签:全景   开发者   生产力   旗帜   算法   首席   科学家   模型   科研   灵魂   核心   过程   能力   价值   基础

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top