AR的相关内容 - 漫话开发者

2024-01-22 talkingdev

腾讯开源PhotoMaker生成风格化人像

生成式图像模型最受欢迎的用途之一是个性化风格的图像生成。历史上，这需要训练LoRA或使用DreamBooth。现在，通过使用ID嵌入，您可以在仅使用单张图像的情况下大大提高质量并降低计算成本。

2024-01-22 talkingdev

随着最近将扩散模型用于各种其他视觉任务的趋势，本研究改进了超分辨率的训练稳定性和缩放。

2024-01-22 talkingdev

近日，GitHub开源了一项名为FILCO的技术，旨在通过上下文过滤来提高人工智能系统的性能，特别是在回答问题和核查事实等领域。该技术的工作原理是选择最有用的信息，并训练模型来过滤掉不相关的细节。相比传统的人工...

2024-01-22 talkingdev

研究人员开发了一种新方法，称为相互蒸馏学习(MDPR)，通过结合两种不同的技术，增强了人物再识别。该方法利用两个网络相互学习，一个网络学习到了身份特征，另一个网络学习到了外观特征，从而提高了人物再识别的准确...

2024-01-22 talkingdev

本文探讨了当前主流的预训练语言模型加入多模态功能的范式。即，在编码器和文本模型之间对齐嵌入。该方法能够让语言模型更好地理解来自视觉和听觉等多个模态的信息，从而提高其自然语言处理的能力。近年来，语言模型...

2024-01-22 talkingdev

以往认为难问题需要难数据，但这些数据很难标记且带噪音。这项研究表明，对相关但易处理的数据进行微调训练，可以极大提高模型解决难问题的能力。这是支持微调训练是引出知识而非添加知识的又一数据点。本研究成果对...

2024-01-22 talkingdev

Sakana.ai正在东京建立世界级研究实验室，以建立更小、更高效的基础模型。该公司由前谷歌研究员David Ha和Llion Jones创立，他们负责转型、世界模型和LoRA等突破性技术。它已获得了来自Lux Capital的Brandon Reeves...

2024-01-22 talkingdev

据悉，最近发布的Stablecode 3B模型表现出色，其强大的性能超过了7B的CodeLlama模型。同时，该模型的尺寸足够小，能够在MacBook上本地运行，无需像7B模型一样需要大量的计算资源。这一模型的发布，标志着技术领域的...