分类基础模型下的文章

DFF：通过特征场蒸馏分解NeRF用于编辑

作者: wyli
时间: 2024-06-16
分类: 基础模型,视觉模型
780 次阅读
评论

NeRF是一个有前景的场景表示方法，可根据观测图片实现高质量的3D重建和新视角合成。然而，编辑NeRF表示的场景有很大的挑战，尤其是选择性的编辑特定场景和对象。为了解决该问题，DFFs作者们把2D图片特征抽取器的知识蒸馏到3D特征场，且同时优化辐射场。

- 阅读剩余部分 -

NeRF：利用神经辐射场作为场景表示用于视角合成

作者: wyli
时间: 2024-06-09
分类: 基础模型,视觉模型
604 次阅读
1 条评论

NeRF是一个利用全连接深度网络优化潜在连续体积场景函数的方法合成新视角的方法。该方法有两个步骤，分别是场景表示和体积渲染，可见图1所示。

- 阅读剩余部分 -

通用感知模块Perceiver与Fourier特征

作者: wyli
时间: 2024-06-05
分类: 基础模型
530 次阅读
4 条评论

感知模型的网络架构往往受限于特定模型，例如：卷积神经网络只能处理2D图片视觉信息。然而，现实世界往往需要处理多种模态，而只是把每个模型的特征concat到一起是不合理的。Perceiver是一个可以处理不同模态的网络架构，且该架构不具有特定的推断偏差，网络架构可见图1所示。同时，为了引入模态中的时空信息，利用Fourier特征增加位置信息。

- 阅读剩余部分 -

Beta-VAE：利用一个受约束的变分框架学习基本的视觉概念

作者: wyli
时间: 2024-05-21
分类: 生成模型,基础模型
708 次阅读
1 条评论

学习一个任务的困难程度显著的受到数据表示方式的影响。根据相关文献，可知，数据生成因子的一个disentangled representation可适用于大量的任务与领域。其中，disentangled representation被定义为单个隐式单元对单个生成因子的变化较敏感，且对其它因子的变化保持相对不变。

- 阅读剩余部分 -

一文看懂基础模型在机器人领域的应用与机器人的基础模型的研究进展

作者: wyli
时间: 2024-04-28
分类: 基础模型
676 次阅读
评论

- 阅读剩余部分 -

MobileLLM：优化小于1B参数的大语言模型

作者: wyli
时间: 2024-04-21
分类: 基础模型,大语言模型
573 次阅读
评论

大语言模型正在渗透人类生活各种方面，不仅影响人类的交流与工作，而且重塑每日娱乐生活方面。然而，LLMs运行在云环境中，需要大量的计算资源，这不仅导致大语言模型无法部署在移动设备上，而且对能量消耗与碳排放带来了巨大挑战。根据该观察，MobileLLM是一个小于1B参数量的模型，可部署在移动设备上，且与同规模的模型相比性能得到了提升，可见图1所示。

- 阅读剩余部分 -