Transformer的相关内容 - 漫话开发者

2023-10-02 talkingdev

Transformer-VQ：一种高效的线性时间关注模型

最新的研究成果Transformer-VQ，是一种全新设计的Transformer，由于其独特的基于向量的键和缓存功能，使得处理注意力的速度得到了显著的提升。这种新型的Transformer设计，不仅提高了处理速度，同时也保持了数据的准...

2023-10-02 talkingdev

近几周出现的最酷、最简洁的视觉论文之一。视觉变换器使用“无用”的像素值作为存储全局信息的地方，这使得注意力映射变得难以解读。然而，如果你向词汇表中加入一个简单的 [reg] 标记，模型就会使用它，而不会将信息...

2023-09-25 talkingdev

最新版本的Flash Attention在提升模型上下文长度和性能的同时，其速度也得到了极大的提升。目前，Flash Attention正在被HuggingFace生态系统本地化支持的过程中。Flash Attention的升级不仅仅提升了模型的运算速度，...

2023-09-20 talkingdev

Matting是一种创建黑白掩膜以分割出图像重要部分的过程。它通常用于前景和背景的分割。智能手机的人像模式使用了一种与这里描述的ViTMatte相似的方法。这种技术发展现代化，为未来的图像处理技术开创了新的可能。此...

2023-09-19 talkingdev

对预训练的视觉模型进行特定任务的微调，通常需要大量额外的计算能力。然而，研究人员已经提出了一种名为“显著通道调整”（SCT）的方法，这种方法可以智能地选择模型中需要微调的部分，使用的额外设置要远少于其他方...

2023-09-18 talkingdev

变压器是一种智能算法，通常用于处理文本或图像。这个项目调整了它们，使其能够与EEG数据一起工作，以更好地理解睡眠阶段。变压器的这种新应用打开了一个新的可能性，即通过使用复杂的深度学习模型来解决健康问题，...

2023-09-08 talkingdev

在变压器网络中，前馈层占据了大部分的总权重。然而，如果你使用一个单一的大型前馈层，共享给编码器和解码器，你可以显著提高推理时间，同时性能的下降微乎其微。这是一种有效的优化手段，可以有效提升网络的运行效...

2023-08-22 talkingdev

我们当前的时代正处于一个全新的人工智能阶段，这个阶段的特点是LLMs、变压器和扩散模型的广泛应用。这与以往的人工智能发展阶段有着明显的区别。LLMs是一种复杂的深度学习模型，可以处理大量的数据并预测结果。变压...