EAI猩球

Sharing knowledge, Acquiring technology.

首页 归档 链接 关于

分类 持续RL 下的文章

RL算法不适用于持续型任务的技术点及应对方法

  • 作者: wyli
  • 时间: 2025-02-09
  • 分类: 持续RL,持续学习
  • 239 次阅读
  • 评论

时下,RL主要处理episode任务或单一episode的持续任务,论文《Discounted Reinforcement Learning Is Not an Optimization Problem》分析了该范式的技术有哪些不适用于显著不同episode的持续任务的呢?

- 阅读剩余部分 -

最新文章

  • 指数族与自然指数族分布
  • Fisher信息度量
  • 率失真
  • 信息瓶颈方法
  • 矩阵范数与Spectral标准化
  • Lipschitz Continuity
  • RL的正则化
  • 分布式RL:方法
  • GANs的演进与训练技巧
  • RL扩展:网络架构

标签云 (Top20)

  • 扩散模型
  • 大规模RL
  • GANs
  • 激活函数
  • Transformers
  • Flows
  • 表示学习
  • 扩散策略
  • VAEs
  • 神经网络特性
  • Attentions
  • ALOHAs
  • RL关键点
  • NN可塑性
  • 微调
  • Bipedals
  • NeRFs
  • LoRAs
  • 对比学习
  • RL样本高效

分类

  • 理论(35)
    • 数学(10)
    • 信息论(3)
    • 认知科学(1)
    • AI理论(18)
  • 基础模型(70)
    • 生成模型(19)
    • 视觉模型(8)
    • White-Box网络(2)
    • 大语言模型(6)
    • 多模态模型(10)
    • VLA模型(7)
  • 演化学习(3)
  • 持续学习(2)
    • 持续RL(1)
  • 强化学习(20)
    • 基于策略(1)
    • 基于值(1)
    • Actor-Critic(5)
  • Offline RL(3)
  • 模仿学习(10)
  • AI系统(3)
  • Robot学习(28)
© 2025 EAI-Star. Powered by Typecho. 备案号: 沪ICP备2023018970号-2