最新研究!使用人类语言,能让机器人学得更快

普林斯顿大学的研究人员探索了一种新的机器人教学方法,他们发现人类语言对工具的描述可以加速模拟机械臂举起和使用各种工具的学习。

结果建立在证据之上,即在人工智能 (AI) 训练期间提供更丰富的信息可以使自主机器人更适应新情况,从而提高其安全性和有效性。

将工具形式和功能的描述添加到机器人的训练过程中,可以提高机器人操纵新遇到的工具的能力,这些工具不在原始训练集中。

一组机械工程师和计算机科学家在机器人学习会议上介绍了新方法,即使用语言加速学习工具操作。

机械臂在帮助完成重复性或具有挑战性的任务方面具有巨大的潜力,但训练机器人有效地操作工具是很困难的:工具的形状多种多样,而且机器人的灵巧性和视觉是人类无法比拟的。

语言形式的额外信息可以帮助机器人更快地学习使用这些工具 。

通过查询 GPT-3 获得了工具描述,它使用一种称为深度学习的 AI 形式来响应提示生成文本。在尝试了各种提示后,决定使用“以详细和科学的方式描述[工具]的[特征]”,其中特征是工具的形状或用途。

Karthik Narasimhan 说:“因为这些语言模型是在互联网上训练的,所以从某种意义上说,你可以认为这是一种不同的检索信息的方式”,比使用众包或抓取特定网站来获取工具描述更有效、更全面。

Narasimhan 是普林斯顿自然语言处理 (NLP) 小组的首席教员,并作为 OpenAI 的访问研究科学家为最初的 GPT 语言模型做出了贡献。

这项工作是 Narasimhan 和 Majumdar 研究小组之间的首次合作。Majumdar 专注于开发基于人工智能的政策,以帮助机器人——包括飞行和步行机器人——将它们的功能推广到新的环境,他很好奇最近“自然语言处理方面的巨大进步”有利于机器人学习的潜力。”他说。

对于他们的模拟机器人学习实验,该团队选择了一套包含 27 种工具的训练集,从斧头到橡皮扫帚。他们给机械臂分配了四种不同的任务:推动工具、提起工具、用它沿着桌子扫动圆柱体,或者将钉子锤入孔中。

研究人员使用包含和不包含语言信息的机器学习训练方法开发了一套策略,然后比较了策略在九个工具的单独测试集上的性能以及配对描述。

这种方法被称为元学习,因为机器人提高了它在每个连续任务中的学习能力。

Narasimhan 说,它不仅要学习使用每种工具,还要“努力学习理解这百种不同工具中每一种的描述,因此当它看到第 101 种工具时,它会更快地学习使用新工具”。“我们在做两件事:我们教机器人如何使用工具,但我们也在教它英语。”

研究人员使用九种测试工具测量了机器人在推、举、扫和锤击方面的成功率,并将在机器学习过程中使用语言的策略与不使用语言信息的策略所取得的结果进行了比较。在大多数情况下,语言信息为机器人使用新工具的能力提供了显着优势。

“一项显示政策之间显着差异的任务是使用撬棍沿着桌子扫动圆柱体或瓶子”,博士 Allen Z. Ren 说。

“通过语言训练,它学会了抓住撬棍的长端,并利用曲面更好地限制瓶子的移动,”任说。“有语言,它把撬棍紧贴在曲面上,更难控制。”

这项研究得到了丰田研究所 (TRI) 的部分支持,并且是Majumdar研究小组中一个更大的 TRI 资助项目的一部分,该项目旨在提高机器人在与其训练环境不同的新情况下发挥作用的能力。

广泛的目标是让机器人系统——特别是那些使用机器学习训练的系统——推广到新环境。

#头条创作挑战赛#

展开阅读全文

页面更新:2024-05-10

标签:普林斯顿   机器人   撬棍   语言   圆柱体   研究人员   人类   策略   能力   工具   最新   信息

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top