“PromptIR”是一种新方法,使用提示信息从退化版本中恢复高质量图像,无论退化的类型或严重程度如何。这种先进技术适用于各种图像问题,如噪声、模糊和雾霾。
Read More这项研究揭示了大型语言模型(LLMs)在处理不同任务时可以胜任,但在概率推理方面存在困难,从而限制了它们的性能。作者提出了一种名为Tart的解决方案 - 一种在通用方式下训练的推理模块,当与任何现有模型结合时,...
Read More这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...
Read More近日,研究人员提出了一种名为“对比输入解码(CID)”的新方法,旨在通过生成反映两个略有不同输入的独特特征的文本来揭示AI语言模型对微小变化的反应,从而使其响应更加易于理解和管理。这对于确保公平性和实用性至...
Read More近日,研究人员开发了一种新方法,名为BlendFields,旨在更精确地模拟出人脸的表情细节。该方法借鉴了传统计算机图形学技术,通过使用一些极端的面部表情来重新塑造新的表情,从而达到更细致、更真实的面部细节。...
Read MoreProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling(SDS)方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...
Read More近日,有一篇论文提出了一种新的方法,旨在改进计算机理解和将日常语言转换为SQL的能力。该方法通过查看代码的整个部分而非单个单词来纠正错误,并使用一种新的SQL查询表示法,更接近于现有代码语言模型的工作方式,...
Read MoreTWIST是一种新的训练语音语言模型(SpeechLMs)的方法,它使用预先训练的文本模型来进行热启动。该方法优于从头开始训练,经验分析强调了模型和数据集规模的重要性。这项研究介绍了迄今为止最大的SpeechLM,并引入了...
Read More