分类 Robot学习下的文章

Sim-to-Real技术总结(二)

作者: wyli
时间: 2024-12-16
分类: Robot学习
2106 次阅读
评论

在机器人领域，为了降低学习成本，往往需要在仿真环境中训练RL智能体。然而，仿真与现实之间存在很大的GAP。目前，主要通过电机建模、自适应、领域随机化、系统识别、特权信息、重力补偿、以及GAP建模的方式减少sim-to-real之间的GAP。

- 阅读剩余部分 -

在物理世界构建可快速响应智能体的方法

作者: wyli
时间: 2024-09-15
分类: AI系统,Robot学习
1268 次阅读
3 条评论

第一人称视角的无人机比赛需要专业的飞行队员远程操作高速无人机穿过3D环，可见图1所示。在比赛中，无人机承受的力超过自身重力的5倍多，达到的速度$100km/h$，加速度为重力加速度的许多倍。

- 阅读剩余部分 -

Consistency Policy：通过一致性蒸馏加速视觉运动策略

作者: wyli
时间: 2024-07-04
分类: 模仿学习,Robot学习
1473 次阅读
评论

由于空间、重量、以及电量的约束，大部分机器人系统无法配备高端GPUs。扩散策略在机器人控制的模仿学习领域实现了惊人的性能。然而，扩散策略的推理速度较慢，需要多步迭代才能生成动作。这种推理速度慢的约束限制了扩散策略的应用范围。为了保留扩散策略的性能且减少推理时间，Consistency Policy作者们通过对扩散策略的蒸馏，得到了一致性策略。

- 阅读剩余部分 -

DeepMind利用Self-Play实现Humanoid踢足球比赛

作者: wyli
时间: 2024-06-01
分类: AI系统,Robot学习
761 次阅读
评论

在足球比赛的场景下，Humanoid面对的是一个动态的而非开放式的环境，不仅需要机器人能够监测和理解环境的变化，且需要根据情况制定目标并做出实时响应。虽然它面对的复杂性相较于自动驾驶汽车面对的动态且开放环境的复杂性相对较低，但是在足球比赛场景下可很方便的研究Humanoid的EAI(Embodied AI)技术，该技术也可迁移到其它环境，例如：工厂，也是迈向开放环境坚实的一步。同时，足球比赛能够体现出人类运动智能的许多方面。

- 阅读剩余部分 -

ExBody：富有表达力的WBC

作者: wyli
时间: 2024-04-26
分类: Robot学习
1218 次阅读
评论

对于机器人来说，由于自由度与物理能力限制的原因，往往倾向于产生不自然的运动形态，这种运动呈现不自然且缺乏优美与个性化。为了使人形机器人学习出与人体运动在表达性与丰富性上相媲美的全身运动控制策略，ExBody作者们通过把大规模人类运动捕获数据与强化学习相结合，学习出可直接部署到真实机器人上的全身控制器。同时，为了解决机器人局限性导致直接精确模仿参考运动不可行的问题，提出以参考运动与root运动命令作为控制器的输入。确切的说，机器人的upper body模仿各种各样人类运动以提高表达性，松弛双腿运动模仿项以提高鲁棒性。

- 阅读剩余部分 -

FLD：结构化运动表示与学习的傅利叶隐式动力学

作者: wyli
时间: 2024-04-23
分类: Robot学习
1177 次阅读
评论

参考轨迹的可用性极大地推动了运动学习技术的进步。然而，这些技术的泛化性很差。这是因为基于轨迹数据学习得到的策略往往只是记住轨迹实例，而不是理解潜在的动力学结构。同时，高度的非线性与嵌入的高级别相似性阻碍了有效识别与建模运动模式的动力学。与直接从高维状态空间处理原始轨迹数据不同，结构化表示方法在训练期间引入了特定的推断偏差且提供了管理复杂运动的高效方法。FLD是PAE的生成式扩展，利用一个新的预测结构在周期或拟周期运动中抽取时空关系。

- 阅读剩余部分 -