分类基于值下的文章 - EAI猩球

EAI猩球

Sharing knowledge, Acquiring technology.

分类基于值下的文章

SDQN：连续性动作的离散化序列预测

作者: wyli
时间: 2024-01-15
分类: 强化学习,基于值
878 次阅读
2 条评论

连续空间的控制问题一致很难被有效解决，这是因为动作空间每个维度的离散化会导致动作的组合呈指数级爆炸。

- 阅读剩余部分 -