EAI猩球

浅谈状态空间模型SSM基础理论

作者: wyli
时间: 2024-08-29
分类: 基础模型
评论
1815 次阅读

状态空间模型是一个描绘系统随时间变化的动态行为，被广泛应用在控制理论、机器人、以及经济学。状态空间模型通过一系列隐藏变量，被称为“状态”，高效的捕获时序数据的依赖关系，从而具象化形态的行为。确切的说，状态空间模型由两种方程构成，分别是：状态方程和观测方程，从而构建时刻$t$输入$x(t)\in\mathbb{R}$和输出$y(t)\in\mathbb{R}$的关系。其中，隐藏状态$h(t)\in\mathbb{R}^N$的维度为$N$。

- 阅读剩余部分 -

AI与效率

作者: wyli
时间: 2024-08-26
分类: 理论
评论
474 次阅读

文章来源于OpenAI's Blog：AI and efficiency

注：文章直接用Google翻译，可能存在不准确的情况，所以也贴出了英文原文。

- 阅读剩余部分 -

AI与计算

作者: wyli
时间: 2024-08-26
分类: 理论
评论
376 次阅读

文章来源于OpenAI's Blog：AI and compute

注：文章直接用Google翻译，可能存在不准确的情况，所以也贴出了英文原文。

- 阅读剩余部分 -

生成式建模的流匹配

作者: wyli
时间: 2024-08-25
分类: 生成模型,基础模型
3 条评论
934 次阅读

扩散模型的性能虽优越，但是其限制了采样概率路径的空间。同时，扩散模型不仅拥有较长的训练时间，还需要通过蒸馏等方法提高采样效率。与之相比，连续正则化流CNFs能够建模任意的概率路径，但受限于无可扩展的CNF训练算法。为了解决CNFs模型训练的不稳定性，流匹配FM是一个基于回归固定条件概率路径向量场的Simulation-Free训练方法，为CNFs模型训练提供了等效梯度。该方法不仅拥有较好的样本质量，且训练与推理效率得到了很大的提升。

- 阅读剩余部分 -

RBO：鲁棒的黑盒优化算法

作者: wyli
时间: 2024-08-24
分类: 演化学习
评论
427 次阅读

在利用结构化随机正交矩阵对演化策略的梯度进行高效近似之后，Krzysztof等人提出RBO，该方法利用鲁棒的回归方法学习梯度流方式使黑盒优化算法拥有off-policy更新的能力。

- 阅读剩余部分 -

SNR PUN：为了RL的泛化性而正则化参数不确定性

作者: wyli
时间: 2024-08-18
分类: 强化学习
评论
441 次阅读

为了使RL智能体能够部署到真实世界环境，必须要能够泛化到未观察到的环境。然而，RL很困难实现分布外的泛化，这是由于智能体往往过拟合于训练环境的细节。虽然监督学习的正则化技术可以被用于避免过拟合，但是RL与监督学习之间的差别限制了它们的应用。为了处理泛化性问题，SNR PUN作者们提出了信噪比正则化参数不确定性网络。

- 阅读剩余部分 -

浅谈状态空间模型SSM基础理论

AI与效率

AI与计算

生成式建模的流匹配

RBO：鲁棒的黑盒优化算法

SNR PUN：为了RL的泛化性而正则化参数不确定性

最新文章

标签云 (Top20)

分类