深度学习9个小时内教会机器人拿起和剥开香蕉

标签:机器人,深度学习 时间:2022-07-01 21:25:35.318 发布者:小木

论文名:Robot peels banana with goal-conditioned dual-action deep imitation learning
发布时间:2022年3月
论文地址:https://arxiv.org/abs/2203.09749
代码地址:

原文摘要:由于对象建模的困难和缺乏关于稳定和灵巧的操纵技能的知识,对可变形对象的长视距灵巧机器人操纵任务,如剥香蕉,是有问题的。本文提出了一个目标条件的双行动深度模仿学习(DIL),它可以利用人类的示范数据学习灵巧的操纵技能。以前的DIL方法映射了当前的感觉输入和反应动作,这很容易失败,因为模仿学习中由动作的反复计算引起的复合误差。所提出的方法在需要精确操纵目标物体时预测反应动作(局部动作),在不需要精确操纵时生成整个轨迹。这种双行动表述有效地防止了基于轨迹的全局行动的复合误差,同时用反应性的局部行动应对目标对象的意外变化。此外,在这种表述中,全局/局部行动都以目标状态为条件,该目标状态被定义为每个子任务的最后一步,以实现稳健的策略预测。所提出的方法在实际的双臂机器人中进行了测试,并成功地完成了剥香蕉的任务。