分类演化学习下的文章

EAI猩球

Sharing knowledge, Acquiring technology.

分类演化学习下的文章

RBO：鲁棒的黑盒优化算法

作者: wyli
时间: 2024-08-24
分类: 演化学习
1021 次阅读
评论

在利用结构化随机正交矩阵对演化策略的梯度进行高效近似之后，Krzysztof等人提出RBO，该方法利用鲁棒的回归方法学习梯度流方式使黑盒优化算法拥有off-policy更新的能力。

- 阅读剩余部分 -

基于压缩架构的结构化演化以实现可扩展策略优化

作者: wyli
时间: 2024-08-17
分类: 演化学习
717 次阅读
1 条评论

经典的演化算法很难解决高纬问题。然而，Salimans等人的研究表明黑盒优化算法在机器人控制任务可展现与RL相媲美的性能。同时，演化策略拥有相对简单性、通用性、以及并行化的特点，因此对它的研究又产生了兴趣。Krzysztof等人利用结构化随机正交矩阵进行梯度近似，从而学习出了一个可快速训练和快速推理的策略。

- 阅读剩余部分 -

演化策略作为强化学习的一种可扩展替代方案

作者: wyli
时间: 2024-08-11
分类: 演化学习
1131 次阅读
2 条评论

演化策略属于一类黑盒优化算法，可作为基于MDP框架的强化学习技术的替代方案。与RL相比，演化策略拥有扩展性强、对动作频率和延时奖励不变的特性、容忍极长时间窗口、以及不需要时序折扣或价值函数近似的优势。然而，该方法对较为困难的RL问题并不是非常有效。

- 阅读剩余部分 -

分类演化学习下的文章

RBO：鲁棒的黑盒优化算法

基于压缩架构的结构化演化以实现可扩展策略优化

演化策略作为强化学习的一种可扩展替代方案

最新文章

标签云 (Top20)

分类

分类 演化学习 下的文章

RBO：鲁棒的黑盒优化算法

基于压缩架构的结构化演化以实现可扩展策略优化

演化策略作为强化学习的一种可扩展替代方案

最新文章

标签云 (Top20)

分类

分类演化学习下的文章