SDQN:连续性动作的离散化序列预测 作者: Evan-wyl 时间: 2024-01-15 分类: 基于值,强化学习 330 次阅读 2 条评论 连续空间的控制问题一致很难被有效解决,这是因为动作空间每个维度的离散化会导致动作的组合呈指数级爆炸。- 阅读剩余部分 -