标签 RL泛化性下的文章

EAI猩球

Sharing knowledge, Acquiring technology.

标签 RL泛化性下的文章

SNR PUN：为了RL的泛化性而正则化参数不确定性

作者: wyli
时间: 2024-08-18
分类: 强化学习
441 次阅读
评论

为了使RL智能体能够部署到真实世界环境，必须要能够泛化到未观察到的环境。然而，RL很困难实现分布外的泛化，这是由于智能体往往过拟合于训练环境的细节。虽然监督学习的正则化技术可以被用于避免过拟合，但是RL与监督学习之间的差别限制了它们的应用。为了处理泛化性问题，SNR PUN作者们提出了信噪比正则化参数不确定性网络。

- 阅读剩余部分 -

标签 RL泛化性下的文章

SNR PUN：为了RL的泛化性而正则化参数不确定性

最新文章

标签云 (Top20)

分类

标签 RL泛化性 下的文章

SNR PUN：为了RL的泛化性而正则化参数不确定性

最新文章

标签云 (Top20)

分类

标签 RL泛化性下的文章