深度强化学习的网络深度通常不超过4层,这是因为实验发现过深导致模型无法收敛。然而,深度神经网络可提取抽象表示,从而降低问题的求解难度,这在计算机视觉和自然语言处理领域属于常见的现象。然而,智能体面对的状态空间和动作空间大小是指数级的,那么4层网络显然很难提取到有效的表示。本文尝试回答表示有效的确切原因、以及如何提取Disentangled表示。

- 阅读剩余部分 -

率失真是信息论的一个主要分支,为有损数据压缩提供了理论基础。它处理了每个符号由多少位$R$决定的问题,,以便于源可被接受者重建,且不超过期望的失真$D$。

- 阅读剩余部分 -