大语言模型辅助机器人解析模糊指令并锁定关键细节
设想在不久的将来,你在仓库或办公室工作,需要帮助一名新员工了解基本工作内容,但这名"新员工"其实是一台机器人。为了教会它,你可能需要来一场"示范加讲解"——亲身演示几种不同的操作方式,同时解释你在做什么。
比如,你要求机器人把咖啡放到桌上,但不能打扰你正在进行的视频会议。你希望它不要太靠近你和笔记本电脑,以免影响会议进程。为了实现这一行为,机器人需要用能清晰展示完整任务的数据来进行训练。计算机科学家们此前尝试通过录制大量实物演示或编写详尽操作说明来向机器人解释操作任务。但如果两者不能兼备,机器人很可能会误解自己需要做什么。
让人类同时完成所有的"示范"与"讲解"工作十分耗时费力。为此,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员实现了机器人教学流程的自动化,不仅能自动厘清操作指令,还将所需演示数据量减少了近五倍。他们提出的"掩码逆强化学习"(Masked IRL)方法,利用大语言模型根据用户演示数据对模糊提示进行扩展解读,再由另一个大语言模型筛选出算法在制定运动计划时应纳入的关键细节,从而让机器人能够安全地完成家庭、办公室和工厂中的各类任务。
"当人类与机器人交互时,往往不想把任务的每个细节都说清楚,这时我们的方法就能派上用场,"麻省理工学院博士生、CSAIL研究员、该论文第一作者黄敏英(Minyoung Hwang)表示,"我们的目标是让机器人真正理解用户的意图,从而最大程度地降低人类的操作负担。"
黄敏英指出,Masked IRL能够帮助机器人在复杂环境中安全运动——在这类环境中,往往存在一些人类在操作提示中不会主动说明、却至关重要的元素。例如,机器人去厨房拿零食时,可能不知道要避开你的笔记本电脑;工厂机器人在向不同箱子中放置物品时,也必须小心绕过货架。
在这些场景中学习新任务时,Masked IRL通过机器人的传感器采集周围环境信息,同时记录运动示教过程中的每一个动作——运动示教是一种训练方式,由人类亲手引导机器人执行特定动作,有点像为机器人做物理治疗,通过弯曲关节来示范如何抓取、移动和放置物体。
随后,麻省理工学院的系统调用一个大语言模型,将这一系列动作(即运动轨迹)与最短路径进行比较,并对提示中不明确的内容进行扩展解读,例如将"保持靠近"这类请求转化为"保持靠近桌面"。借助轨迹比较和明确化后的指令,大语言模型开始理解训练动作对于完成任务的意义所在。
第二个大语言模型则负责评估环境细节,例如障碍物的位置和目标物体的形状。在此过程中,它会对判定与当前任务无关的元素进行"掩码"处理(即忽略),并为每个元素打分:"1"代表重要,"0"代表不重要。例如,用户在演示过程中是否靠在桌子上,这类信息会被标记为"0",视为无关因素;而所有被评为"1"的细节,则会由算法纳入最终的行动计划。
这一掩码机制让Masked IRL在三维仿真和真实场景演示中均优于同类基线方法,因为它教会了机器人应该优先关注哪些信息。借助这套系统,虚拟和真实机器人都能灵活地绕过障碍物移动物体,例如绕过笔记本电脑将咖啡杯移到桌上的不同位置。在这些任务中,Masked IRL正确识别用户未在提示中明确表达的偏好的准确率,比同类基线方法最高提升了15%。
在仿真实验中,CSAIL研究人员还发现Masked IRL的学习效率更高。相比基线方法,它只需更少的演示次数就能掌握如何移动马克杯。研究人员还发现,当大语言模型负责厘清指令时,机器人的表现优于直接跟随模糊指令的情况。
这种更聚焦的方法同样适用于真实的机械臂,能够执行系统在训练阶段未曾见过的新指令。在完成50次运动示教训练后,机器人能够小心地将杯子递向人类,同时避免碰撞用户的电脑——这一需要回避的障碍,正是系统通过解析"保持距离"这一笼统请求而习得的。此外,机器人还能在"保持贴近"桌面的前提下完成擦桌任务,以及在同时"远离"人类和桌子的条件下将一袋薯片递给用户。
Masked IRL能够感知并解读用户未言明的意图,而在不久的将来,它还将具备"视觉感知"能力。CSAIL研究人员计划为该系统配备摄像头,使机器人能够拍摄周围环境的图像,进而识别并聚焦于附近的特定元素。例如,当你要求机器人捡起一个玩具时,它可能会先看到旁边的香蕉,并在抓取目标物体之前自动将其忽略。
该论文由黄敏英与三位CSAIL同事共同撰写,包括博士生亚历山德拉·福西-斯梅雷克(Alexandra Forsey-Smerek,学士2020届、硕士2022届)、博士后纳撒尼尔·丹勒(Nathaniel Dennler),以及麻省理工学院助理教授、航空航天系暨CSAIL成员安德烈亚·博布(Andreea Bobu)。该研究得到了塔塔集团通过麻省理工学院生成式AI影响力联盟奖及美国国防部的部分资助。研究团队将于今年6月在2026年IEEE国际机器人与自动化大会上正式发表这一研究成果。
Q&A
Q1:Masked IRL技术是什么?它如何帮助机器人理解指令?
A:Masked IRL(掩码逆强化学习)是麻省理工学院CSAIL研究团队开发的一套机器人教学方法。它利用大语言模型对用户模糊的操作提示进行扩展解读,同时通过第二个大语言模型对环境细节进行重要性评分,忽略无关信息,聚焦关键要素,从而帮助机器人准确理解用户真实意图,并生成合理的运动计划。
Q2:Masked IRL相比传统机器人训练方法有哪些优势?
A:相比传统方法,Masked IRL主要有两大优势:一是大幅减少了所需的演示数据量,训练效率提升近五倍;二是通过大语言模型自动厘清模糊指令,避免了机器人因指令不清而产生误解。此外,该方法正确识别用户隐含偏好的准确率比同类基线方法最高提升15%。
Q3:Masked IRL目前能在真实场景中应用吗?
A:可以。研究人员已在真实机械臂上验证了Masked IRL的实际效果。经过50次运动示教训练后,机器人能够完成多项现实任务,例如绕开笔记本电脑递送杯子、贴近桌面擦拭,以及在远离人类和桌子的前提下递送物品。未来研究团队还计划为系统配备摄像头,进一步增强其对真实环境的感知与理解能力。
-
07.04
男爵最新优惠折扣信息分享男爵史低价格一览
-
07.04
龙珠超宇宙2史低价格 龙珠超宇宙2历史最低折扣及购买时机分析
-
07.04
狂野之心史低价格查询:狂野之心历史最低价及当前折扣信息
-
07.04
家园卡拉克沙漠史低价格一览:购买建议
-
07.04
极限国度史低价格是多少 极限国度历史最低价查询与购买指南
-
07.04
零启战纪英雄推荐指南零启战纪顶尖阵容与角色强度排行榜
-
- Longcat_AI_兼容哪些AI模型?
- 07.04
-
- Longcat_AI_怎样快速上手?新手使用指南
- 07.04
-
- 大语言模型辅助机器人解析模糊指令并锁定关键细节
- 07.04
-
-
- 身为法律顾问
- 07.04
-
- Python 全栈工程师
- 07.04
-
-
下载
- 《神剑伏魔录》(神剑风云)游戏音乐合集
- 其他游戏|7.73 MB
- 一款非常好玩的武侠闯关游戏
-
-
下载
- 《行尸走肉第一章》免安装中文汉化硬盘版下载
- 单机|436 MB
- 一款以动作冒险为主题的游戏
-
-
下载
- 《街头霸王X铁拳》免安装中文汉化硬盘版下载
- 单机|111MB
- 一款非常好玩的格斗游戏
-
-
下载
- 《生化危机:浣熊市行动》免安装中文硬盘版下载
- 单机|6310 MB
- 一款以动作射击为主题的游戏
-
-
下载
- 《暗黑破坏神3》免安装繁体中文正式版下载
- 单机|7630 MB
- 一款以角色扮演为主题的游戏
-
-
下载
- 《马克思佩恩3》免安装硬盘版下载
- 单机|27033 MB
- 一款以第三人称射击为主题的游戏