标签扩散策略下的文章

Consistency Policy：通过一致性蒸馏加速视觉运动策略

作者: wyli
时间: 2024-07-04
分类: 模仿学习,Robot学习
1574 次阅读
评论

由于空间、重量、以及电量的约束，大部分机器人系统无法配备高端GPUs。扩散策略在机器人控制的模仿学习领域实现了惊人的性能。然而，扩散策略的推理速度较慢，需要多步迭代才能生成动作。这种推理速度慢的约束限制了扩散策略的应用范围。为了保留扩散策略的性能且减少推理时间，Consistency Policy作者们通过对扩散策略的蒸馏，得到了一致性策略。

- 阅读剩余部分 -

DP3：3D扩散策略

作者: wyli
时间: 2024-03-20
分类: 模仿学习,Robot学习
991 次阅读
评论

扩散策略算法需要大量的演示数据才能实现较强的泛化性。然而，模仿学习算法收集任务相关的数据耗时很长。为了应对该挑战，DP3把3D视觉表示与扩散策略相整合。

- 阅读剩余部分 -

扩散策略：通过动作扩散进行的视觉运动策略学习

作者: wyli
时间: 2024-01-24
分类: 模仿学习,Robot学习
1583 次阅读
3 条评论

基于演示的策略学习是学习观测到动作映射的监督学习任务。然而，现实中机器人动作具有多峰分布、序列相关、以及高精度要求的特点，与其它监督学习任务相比具有很大的挑战。扩散策略是一个新形式的机器人视觉运动策略。与直接预测动作不同，它以视觉观测为条件推断动作-分数的梯度。这种方式学习到的策略继承了扩散模型许多关键特性：

- 阅读剩余部分 -

标签扩散策略下的文章

Consistency Policy：通过一致性蒸馏加速视觉运动策略

DP3：3D扩散策略

扩散策略：通过动作扩散进行的视觉运动策略学习

最新文章

标签云 (Top20)

分类

标签 扩散策略 下的文章

Consistency Policy：通过一致性蒸馏加速视觉运动策略

DP3：3D扩散策略

扩散策略：通过动作扩散进行的视觉运动策略学习

最新文章

标签云 (Top20)

分类

标签扩散策略下的文章