EAI猩球

动力学随机化：四足机器人运动的案例研究

作者: wyli
时间: 2024-01-19
分类: Robot学习
2 条评论
573 次阅读

Dynamics Randomization Revisited:A Case Study for Quadrupedal Locomotion的作者研究了动力学随机化对足式机器人学习强健运动策略的影响。在sim-to-sim和sim-to-real场景中进行了广泛的消融研究，以理解策略迁移成功的因素。实验结果表明，对于一些场景，动力学随机化即是不必要的；也有一些场景是不足够的，且可能使机器人学习到的策略偏向于保守。作者们主张动力学随机化应该被保守的运用，只对有问题的参数使用随机化。

- 阅读剩余部分 -

IMPALA：分布式RL框架

作者: wyli
时间: 2024-01-18
分类: 强化学习
2 条评论
408 次阅读

为了使单一参数的单个智能体能够解决大量任务，IMPALA作者们提出了重要性权重Actor-Learner架构，可见图1所示。若要智能体同时掌握各种各样的技能，面对最大的挑战是可扩展性，例如：A3C智能体掌握一个领域就需要数十亿的数据和很长时间的训练，更不敢想象一次掌握数十个领域了。

- 阅读剩余部分 -

面对未知：学习一个具有线上系统识别的通用策略

作者: wyli
时间: 2024-01-17
分类: Robot学习
3 条评论
563 次阅读

简单来说，UP-OSI作者们提出了一个学习框架(可见图1)，用于解决机器人领域"Reality Gap"的问题。该学习框架的核心思想是：通过仿真探索“虚拟世界”，提前计算机器人能够遇到的许多可能情况。为了该方法可行，作者们提出了两个假设，分别是

假设存在一种方法可提前计算每种动力学模型的最优策略。
假设存在一种快速方法可知道哪种动力学模型适合观测序列。

- 阅读剩余部分 -

Mobile ALOHA

作者: wyli
时间: 2024-01-17
分类: Robot学习
评论
431 次阅读

Mobile ALOHA是一款可移动的双臂操纵机器人，用于处理日常家务。日常的家务往往需要机器人移动能力和操纵能力协作才能完成，例如：机器人把锅放在冰箱内，机器人先要移动到冰箱前，然后打开冰箱，最后把物品放入冰箱。在打开冰箱的时候，甚至需要机器人底座倒车。然而，前人工作只是移动能力或操纵能力单方面的研究，这与现实相差很大。

- 阅读剩余部分 -

ViT：视觉编码器

作者: wyli
时间: 2024-01-16
分类: 基础模型
2 条评论
578 次阅读

如图1所示，ViT整体架构很简单，由Transformer的Encoder构成，非双向。首先，图片分成$N$块patch，作为输入序列的token。然后，$N$token被打平，再输入线性映射层得到embedding。接下来，patch embedding与position embedding相加输入Encoder。与Bert的class token一样，也有一个可学习类别embedding的token $z_0^0$，其在Encoder对应输出$z_L^0$是整个图片的表示。最后，$z_L^0$输入到MLP网络预测类别，即在图片分类任务上预训练。

- 阅读剩余部分 -

机器人模仿动物的方式学习敏捷技能

作者: wyli
时间: 2024-01-16
分类: Robot学习
1 条评论
403 次阅读

基于强化学习范式的足式机器人能够在复杂的领域运动。然而，复杂的行为很难生成。同时，奖励设计和参数调节都需要花费很长的时间设计。

- 阅读剩余部分 -

动力学随机化：四足机器人运动的案例研究

IMPALA：分布式RL框架

面对未知：学习一个具有线上系统识别的通用策略

Mobile ALOHA

ViT：视觉编码器

机器人模仿动物的方式学习敏捷技能

最新文章

标签云 (Top20)

分类