RT-1:用于真实世界大规模控制的机器人Transformer
在自然语言处理与计算机视觉领域,高容量模型基于开放的不可知的任务训练,可以吸收大规模数据集中呈现的知识,从而学习到通用能力。然后,该模型可以在特定的新任务实现少样本或零样本泛化的能力。这种通用能力在机器人领域更为重要。
DTC:四足机器人可穿越稀疏奖励环境的深度轨迹追踪控制
足式运动是一个复杂的控制问题,它需要精确性和鲁棒性以应对真实世界的挑战。经典的方式是基于逆运动学的轨迹优化控制足式系统。这种层级的基于模型的方法很有吸引力,因为直观的成本函数、精确的规划、泛化性、以及数十年的研究成果积累。然而,模型的不匹配与假设的违反是错误产生的常见源头。另一方面,基于仿真的强化学习产生了空前的鲁棒性策略和恢复技能。尽管如此,所有的学习算法很难应对稀疏奖励的环境,在这样的环境中有效的足迹是稀疏的。
动力学随机化:四足机器人运动的案例研究
Dynamics Randomization Revisited:A Case Study for Quadrupedal Locomotion的作者研究了动力学随机化对足式机器人学习强健运动策略的影响。在sim-to-sim和sim-to-real场景中进行了广泛的消融研究,以理解策略迁移成功的因素。实验结果表明,对于一些场景,动力学随机化即是不必要的;也有一些场景是不足够的,且可能使机器人学习到的策略偏向于保守。作者们主张动力学随机化应该被保守的运用,只对有问题的参数使用随机化。
特征金字塔网络
图片金字塔特征能够提高目标检测器的性能,可见图(1.a)所示,但是由于内存的限制往往导致训练不可行,因此一般不采用这种特征抽取方法。深度卷积神经网络的发展,带来了抽取特征的高效性,不仅能够表示高阶语义信息,也能够应对图片规模的变化。因此,基于卷积神经网络的特征抽取是很自然的方法。