wyli 发布的文章

Sim2Real技术总结(一)

作者: wyli
时间: 2024-01-16
分类: Robot学习
988 次阅读
评论

在机器人领域，为了降低学习成本，往往需要在仿真环境中训练RL智能体。然而，仿真与现实之间存在很大的GAP。目前，主要通过电机建模、自适应、领域随机化、系统识别、特权信息、以及重力补偿的方式减少sim-to-real之间的GAP。

- 阅读剩余部分 -

视觉信息增强的足式机器人在挑战领域运动

作者: wyli
时间: 2024-01-16
分类: Robot学习
431 次阅读
2 条评论

在RMA足式机器人中，主要希望智能体学习到快速适应环境的策略。虽然RMA表现出性能较好，但是没有利用视觉信息。文献[1]，在RMA的基础上增加视觉信息，机器人更能适应挑战的领域上运动。

- 阅读剩余部分 -

足式机器人学习敏捷技能与电机动力学

作者: wyli
时间: 2024-01-15
分类: Robot学习
464 次阅读
3 条评论

经典的控制器是针对特定任务设计的，很难使机器人拥有敏捷的动作和多样的动作，运动呈现不灵活性，且很难应用到户外任务。同时，控制器的设计需要丰富经验的工程师，耗费大量时间才能设计出来，时间成本很高。与之相对的，最近基于强化学习的控制器在仿真环境中能够表现出良好的性能，它的缺点就是仿真与现实之间的gap很难处理，常见有两种处理方法，分别是提高仿真的可信度和提高策略的鲁棒性。

- 阅读剩余部分 -

足式机器人的快速电机自适应

作者: wyli
时间: 2024-01-15
分类: Robot学习
485 次阅读
3 条评论

经典的足式机器人主要是基于物理动力学和控制理论实现，这种方法需要大量的专家设计才能有效果。然而，这种方式仍然无法应对不确定性的环境。最近，基于强化学习和模仿学习的范式取得了很大的成功。然而，强化学习用于机器人存在Sim2Real Gap的问题，阻碍了发展。对于该问题经典的解决方案是利用Sim2Real技术把算法模型从虚拟环境迁移到真实环境，仍然具有很大的挑战。

- 阅读剩余部分 -

Q-Transformer

作者: wyli
时间: 2024-01-15
分类: 基础模型
371 次阅读
评论

在机器人领域中，基于监督学习范式的大容量模型往往受限于被提供的高质量数据。之所以产生这种现象是因为人类往往希望机器人能够比专家更专业。同时，也希望机器人能够基于自己收集的数据取得更好的性能，而不是基于演示数据。在以上问题中，强化学习虽然能够展现出卓越的性能，但是基于强化学习算法的大容量模型很难大规模的实例化。本篇论文主要的目的是把大规模多样数据集与基于Transformer的策略架构结合。

- 阅读剩余部分 -

Decision Transformer

作者: wyli
时间: 2024-01-15
分类: 基础模型
555 次阅读
1 条评论

Decision Transformer效果主要在游戏中评估，并未在机器人领域得到验证。与RL算法相比，该算法的建模思路或思想完全不同。Decision Transformer把RL的序列决策问题变为了条件轨迹序列建模。这样的建模方式会规避掉RL中非线性函数、Bootstrapping、以及off-policy的致命三元素和未来奖励折扣。同时，基于Tansformer的方式能够直接通过自注意力进行信用分配。

- 阅读剩余部分 -