智驾大模型来了,如何实现“人机共智”?

商汤绝影携驾、舱、云三位一体的产品体系亮相2023上海车展,不仅展现了全栈智能驾驶解决方案,还首发6大智能车舱新品。目前已有近30款车型搭载了商汤绝影。

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,过去十年人工智能的技术革命,始于深度学习不断突破,乃至深入工业应用,诞生了一批AI+场景应用,在各个领域都有专属的人工智能模型。但问题是研发周期比较长,研发成本也比较高。从去年底开始,ChatGPT的出现,通用人工智能掀起了一场新的技术革命,特点是以更加高效的方式解决大量开放式任务,这个通用人工智能下的模型更接近人的智能,而且能够产生有智慧的内容。

他做了一个对比:在过去的人工智能系统中,输入多模态的数据,AI模型会输出多个任务的预测。但每一个任务都是事先定义好的,如果要增加一个新的任务,往往要重新设计人工智能系统,采集新的样本,对模型重新训练。这就是为什么说人工智能系统周期长、成本比较高。

然而对于通用人工智能(AGI),输入一些提示词,输出就可以生成各种多模态数据的内容,同时用自然语言描述多重任务,可以覆盖更大更广范围开放式的任务,包括各种智能化的长尾场景,甚至一些主观描述的任务。

表现在汽车领域,智能驾驶场景中,人工智能看到一幅图像,问智能驾驶汽车是否要做出减速时,在AI系统中,首先要进行很多物体的检测,包括文字识别,最终做出决策和判断。在这个流程中每一个模块都是事先定义好的一些任务。而在通用人工智能下,给定一幅图像,可以问系统任何问题,比如这个图标是什么意思,应该怎么做,AGI的模型就可以输出对应的结果,而且能够展示中间一步一步推理过程,告诉你我看到这里面有30公里/每小时的限速牌,前方一百米是学校区域,会有小孩活动,你要注意,所以把车速减到30公里/每小时以下。

“这就告诉我们,可以对它任意提问,都能够做出智能性回答。”王晓刚说。

他说,在新的通用人工智能模式下,实现的人和模型之间的互动,并一起产生各种高质量的内容,形成了“人机共智”,一起创造有智慧的内容。

车载终端采集了大量的数据,在通用人工智能下,人和机器实现了互动,如人输出后,模型输出更多高质量的内容。OpenAI在发明ChatGPT之前,用了很多手工标注数据;ChatGPT出现后,全世界的人都在使用ChatGPT,这个过程给ChatGPT很多数据,到GPT4智能又有了非常大的提升。

与此同时,通用人工智能模型,对算力的要求非常大。比如训练一个GPT3这样的模型,需要上千元的A100(GPU),完成一个模型训练,千亿参数级的模型训练,成本是1200万美元。2018年商汤在上海落地了亚洲最大的算力中心之一,基于该算力中心可以做到自动化数据的标注。

王晓刚说,商汤基于多模态大模型,可做到数据的感知闭环和决策闭环。从前端自动采集高质量的数据,到利用大模型进行自动化的数据标注和产品检测,能够几百倍地提升模型迭代的效率并降低成本。

在智能座舱板块,通用人工智能可以使基模型具备对空间环境理解、用户状态感知、多模态指令解析及多轮逻辑对话、内容生成等一系列能力,进而赋能包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,不断地提升座舱的个性化体验。

王晓刚指出,实际上,智能汽车是通用人工智能实现闭环的一个理想场景,人类已经可以做到人机共驾。未来,车和模型之间能够产生更有效的互动,从而完成从人到车、到模型的互动闭环,通用人工智能可为人们提供更好的驾乘体验,解锁无限的想象空间。

【记者】郜小平

【作者】 郜小平

【来源】 南方报业传媒集团南方+客户端

展开阅读全文

页面更新:2024-03-22

标签:人机   商汤   智能性   模型   座舱   闭环   人工智能   开放式   场景   成本   智能   内容   数据   汽车   系统

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top