最新研究！使用人类语言，能让机器人学得更快

普林斯顿大学的研究人员探索了一种新的机器人教学方法，他们发现人类语言对工具的描述可以加速模拟机械臂举起和使用各种工具的学习。

结果建立在证据之上，即在人工智能 (AI) 训练期间提供更丰富的信息可以使自主机器人更适应新情况，从而提高其安全性和有效性。

将工具形式和功能的描述添加到机器人的训练过程中，可以提高机器人操纵新遇到的工具的能力，这些工具不在原始训练集中。

一组机械工程师和计算机科学家在机器人学习会议上介绍了新方法，即使用语言加速学习工具操作。

机械臂在帮助完成重复性或具有挑战性的任务方面具有巨大的潜力，但训练机器人有效地操作工具是很困难的：工具的形状多种多样，而且机器人的灵巧性和视觉是人类无法比拟的。

语言形式的额外信息可以帮助机器人更快地学习使用这些工具。

通过查询 GPT-3 获得了工具描述，它使用一种称为深度学习的 AI 形式来响应提示生成文本。在尝试了各种提示后，决定使用“以详细和科学的方式描述[工具]的[特征]”，其中特征是工具的形状或用途。

Karthik Narasimhan 说：“因为这些语言模型是在互联网上训练的，所以从某种意义上说，你可以认为这是一种不同的检索信息的方式”，比使用众包或抓取特定网站来获取工具描述更有效、更全面。

Narasimhan 是普林斯顿自然语言处理 (NLP) 小组的首席教员，并作为 OpenAI 的访问研究科学家为最初的 GPT 语言模型做出了贡献。

这项工作是 Narasimhan 和 Majumdar 研究小组之间的首次合作。Majumdar 专注于开发基于人工智能的政策，以帮助机器人——包括飞行和步行机器人——将它们的功能推广到新的环境，他很好奇最近“自然语言处理方面的巨大进步”有利于机器人学习的潜力。”他说。

对于他们的模拟机器人学习实验，该团队选择了一套包含 27 种工具的训练集，从斧头到橡皮扫帚。他们给机械臂分配了四种不同的任务：推动工具、提起工具、用它沿着桌子扫动圆柱体，或者将钉子锤入孔中。

研究人员使用包含和不包含语言信息的机器学习训练方法开发了一套策略，然后比较了策略在九个工具的单独测试集上的性能以及配对描述。

这种方法被称为元学习，因为机器人提高了它在每个连续任务中的学习能力。

Narasimhan 说，它不仅要学习使用每种工具，还要“努力学习理解这百种不同工具中每一种的描述，因此当它看到第 101 种工具时，它会更快地学习使用新工具”。“我们在做两件事：我们教机器人如何使用工具，但我们也在教它英语。”

研究人员使用九种测试工具测量了机器人在推、举、扫和锤击方面的成功率，并将在机器学习过程中使用语言的策略与不使用语言信息的策略所取得的结果进行了比较。在大多数情况下，语言信息为机器人使用新工具的能力提供了显着优势。

“一项显示政策之间显着差异的任务是使用撬棍沿着桌子扫动圆柱体或瓶子”，博士 Allen Z. Ren 说。

“通过语言训练，它学会了抓住撬棍的长端，并利用曲面更好地限制瓶子的移动，”任说。“有语言，它把撬棍紧贴在曲面上，更难控制。”

这项研究得到了丰田研究所 (TRI) 的部分支持，并且是Majumdar研究小组中一个更大的 TRI 资助项目的一部分，该项目旨在提高机器人在与其训练环境不同的新情况下发挥作用的能力。

广泛的目标是让机器人系统——特别是那些使用机器学习训练的系统——推广到新环境。

#头条创作挑战赛#

展开阅读全文

页面更新：2024-05-10

标签：普林斯顿机器人撬棍语言圆柱体研究人员人类策略能力工具最新信息

1 2 3 4 5

最新研究！使用人类语言，能让机器人学得更快

资讯 - 最高补助1000万元，驻马店出台促进新能源电池产业发展举措

新乡市牧野区学习先进地区模式经验为经济高质量发展提供助力

180多家银行面临暴雷！中日德法同时抛售美债，美财长或近期访华

海关落实主动披露，企业顾虑少了，负担轻了

日本《日经亚洲》：社会投资工具可填补亚洲发展中国家资金缺口

美股三大指数集体收涨热门科技股涨跌不一

入职先办信用卡为公司“借钱”？南宁7人被“套路”数十万元

威海汇聚金融“活水”，助推经济高质量发展

助力孵育更多“小巨人”，2023宝安专精特新政策宣讲会举办

三里屯建设青年人才会客厅，首批30人入选榜单

影响金融深化与产业结构升级的主要因素有哪些？

烟台高新区开展共建“美德信用高新”现场宣讲会

怀化经开区供电公司：持续乡村振兴赋能为美丽乡村添色

《父母爱情》村姑不简单，秀娥是邓超老师，桂英星二代年轻时美

北京捕获的日本间谍原来是藏在这家公司

日本《日经亚洲》：社会投资工具可填补亚洲发展中国家资

湖南方盛制药股份有限公司公布受让药品生产技术的最新

TT：我仍可以打出高水准比赛有能力踢现今很多主力&

ChatGPT: 请你列出十种最热门的编程语言，并说明其主要

周鸿祎：中国大语言模型和GPT6后可能会有意识

最新消息：为高登鸣不平

怀化市鹤城区第二届青少年机器人竞赛举行

看了AI设计的令人惊艳的梳子，真替人类设计师的饭碗担心

摊牌了？华为徐直军正式官宣：华为已完成14nm以上EDA工具

小米11Ultra遭网友魔改，塞下9800毫安大电池，续航能力翻