EAI猩球

Sharing knowledge, Acquiring technology.

首页 归档 链接 关于

分类 AI理论 下的文章

RoFormer:旋转位置编码增强Transformer

  • 作者: wyli
  • 时间: 2024-04-01
  • 分类: 理论,AI理论
  • 455 次阅读
  • 3 条评论

经典Transformer架构的位置编码属于绝对位置编码,即没有显式的包含相对位置信息。RoPE作者提出了旋转位置编码,利用旋转矩阵编码位置信息,且显式的包含相对位置信息。同时,对RoPE的推导和理论解释给出了详细的表述。

- 阅读剩余部分 -

  1. « 前一页
  2. 1
  3. 2
  4. 3
  5. 4

最新文章

  • 从信息论和矩阵计算的角度理解神经网络
  • 扩散模型的可控生成与引导
  • 扩散模型解决RL问题(一)
  • 生成式AI与RL相遇
  • BFMs:行为基础模型的SF与FB表示
  • 世界模型是什么?
  • EvoRL(二):EPO算法
  • EvoRL(一):为什么要演化算法与RL结合?
  • Constrained RL(一):策略优化理论
  • RL中表示(二):表示的评估与提取方法

标签云 (Top20)

  • 扩散模型
  • 大规模RL
  • GANs
  • 激活函数
  • Transformers
  • Flows
  • 生成式AI与RL
  • 表示学习
  • VAEs
  • 神经网络特性
  • Attentions
  • ALOHAs
  • RL关键点
  • NN可塑性
  • 微调
  • 扩散策略
  • Bipedals
  • NeRFs
  • LoRAs
  • 对比学习

分类

  • 理论(37)
    • 数学(11)
    • 信息论(3)
    • 认知科学(1)
    • AI理论(19)
  • 基础模型(75)
    • 生成模型(21)
    • 视觉模型(8)
    • White-Box网络(2)
    • 大语言模型(6)
    • 多模态模型(10)
    • VLA模型(7)
  • 演化学习(3)
  • Continual学习(2)
    • Continual RL(1)
  • 强化学习(28)
    • 基于策略(1)
    • 基于值(1)
    • Actor-Critic(5)
  • Offline RL(3)
  • 模仿学习(10)
  • AI系统(3)
  • Robot学习(28)
© 2025 EAI-Star. Powered by Typecho. 备案号: 沪ICP备2023018970号-2