分类 Robot学习下的文章

从离线演示数据中学习的关键点

作者: wyli
时间: 2024-02-17
分类: 模仿学习,Robot学习
620 次阅读
1 条评论

机器人操作是一个时间演化动力系统，需要精细实时控制才能引导机械臂成功完成各种任务。

- 阅读剩余部分 -

IBC：隐式行为克隆

作者: wyli
时间: 2024-02-16
分类: 模仿学习,Robot学习
622 次阅读
1 条评论

IBC(Implicit Behavior Cloning)在原理上很简单，就是把行为克隆视作基于能量建模的问题。在推理阶段执行通过采样或梯度下降寻找最优动作$\hat{\mathbf{a}}$的方式执行隐式回归，可见式(1)。

- 阅读剩余部分 -

BeT：一次克隆K个模式

作者: wyli
时间: 2024-02-15
分类: 模仿学习,Robot学习
407 次阅读
1 条评论

行为克隆算法的前提假设是数据来自于解决特定任务单一模式的专家演示。然而，真实世界的预先收集的数据包含行为的多个模式，即使是同一个人对同样的行为也会展示多种模式。另一方面，Transformer模型容量足够大，且拥有建模多种token的能力。因此，BeT把Transofmer与Behavior Cloning相结合以能够预测多峰分布的动作。

- 阅读剩余部分 -

ABS：学习无碰撞高速运动

作者: wyli
时间: 2024-02-13
分类: Robot学习
374 次阅读
评论

ABS是一款四足机器人在杂乱环境中敏捷且高速运动的全新框架。与利用线上系统识别和迁移学习方式实现快速运动的方式不同，该框架有两个策略：敏捷策略以实现执行敏捷电动机技能和恢复策略以保护机器人安全。训练过程包含敏捷策略学习、避碰价值网络、恢复策略学习、以及外部感知表示网络，这些网络在仿真环境中训练完成之后，直接部署到真实机器人上。其中，避碰价值网络主要作用是管理策略的切换。最终，该机器人能够实现高速运动，且可以躲避静态和动态障碍物的能力。

- 阅读剩余部分 -

基于RL的快速运动

作者: wyli
时间: 2024-02-04
分类: Robot学习
395 次阅读
1 条评论

在自然领域高速运动是很有挑战的，这是因为不同的领域需要机器人拥有不同的运动特性。若机器人尝试以更快的速度运行，那么领域变化对控制器性能的影响越来越大。解决这种问题一种可能的方式是设计精巧的模型和设计基于模型的控制器，即基于模型的控制(Model-Based Control, MBC)。然而，基于模型的控制器使机器人的行为和鲁棒性依赖于工程师的创新和大量时间的投入。同时，也需要设计控制尽可能简单以满足实时控制的要求。另外一种方式是基于完备的物理模型优化机器人动作，也即轨迹优化问题。由于完备物理模型的复杂性导致其几乎无法实时控制机器人。最后一种方法就是强化学习，这是一种基于学习的控制器，不需要精确的建模，智能体不断与环境交互使其自身累积奖励最大化，从而学习到鲁棒性较强的策略。

- 阅读剩余部分 -

扩散策略：通过动作扩散进行的视觉运动策略学习

作者: wyli
时间: 2024-01-24
分类: 模仿学习,Robot学习
817 次阅读
3 条评论

基于演示的策略学习是学习观测到动作映射的监督学习任务。然而，现实中机器人动作具有多峰分布、序列相关、以及高精度要求的特点，与其它监督学习任务相比具有很大的挑战。扩散策略是一个新形式的机器人视觉运动策略。与直接预测动作不同，它以视觉观测为条件推断动作-分数的梯度。这种方式学习到的策略继承了扩散模型许多关键特性：

- 阅读剩余部分 -