漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-26 talkingdev

FreeTraj-无需训练自由控制视频生成轨迹

FreeTraj是一种使用扩散模型控制视频生成中的运动轨迹的无需调整的方法。它修改了噪声采样和注意力机制,以指导生成的内容。通过这种方法,用户可以直接操控视频生成的过程,以实现特定的动态效果。FreeTraj的核心优...

Read More
2024-06-03 talkingdev

FABRIC:无训练提升图像生成质量的开源方案

近日,一个名为FABRIC的新方法在GitHub上引起了广泛关注。FABRIC是一种在推理阶段无需训练即可提升图像生成质量的方法。它通过使用评分函数或图像示例来指导输出质量,从而显著改善生成图像的视觉效果。该方法的最大...

Read More
2023-12-22 talkingdev

论文:Diff-Text,无需训练的多语言场景文本生成技术

Diff-Text是一种新的无需训练的框架,可用于创建任何语言的具有文本的逼真图像。它通过使用手绘图像作为先验,增强了稳定扩散模型的多语言能力。

Read More
2023-10-17 talkingdev

MosaicFusion:无需训练即可制作新图像的工具开源

MosaicFusion是一款神奇的工具,可以创建许多对象的新图片,而无需任何先前的学习。它分两步完成:首先制作图片,然后创建一个遮罩,显示每个对象的位置。

Read More
2023-09-15 talkingdev

论文:无需训练即可对齐语言模型,效果提升至81%

对齐技术有助于使语言模型更有用且无害。虽然有时可能会损害性能,但总的来说,这是一项正面的技术。对齐是昂贵的,需要大量的对齐数据。然而,如果您允许模型在生成后评估自身的输出并进行回溯,它可以提高冻结模型...

Read More
2023-08-04 talkingdev

论文:无需训练的实例分割,颠覆图像识别技术

此研究引入了一种名为“无需训练的实例分割”的全新方法,该方法无需进行繁琐的训练或详细的图像注释,就能在图像中分割实例。该方法通过使用现有的语义分割模型并通过可学习的对象边界分支对输出进行精炼,无需额外的...

Read More
2023-07-26 talkingdev

TF-ICON:无需训练的文本驱动图像合成新框架开源

最近,一个名为TF-ICON的新技术在GitHub上引起了广泛关注。该方法利用文本来指导将对象无缝集成到不同的图像中,无需进行额外的训练或调整模型。这种方法的独特之处在于使用了一个'卓越提示',能够从真实的图像中精...

Read More
2023-05-29 talkingdev

无需训练,用GPT-4学习Minecraft

## 新闻摘要: - GPT-4被广泛认为是迄今为止最强大的语言模型。 - Voyager将代码作为“策略表示”,并使用环境错误和性能作为自然语言反馈,从而让GPT4能够逐步改进挖掘钻石等任务。 - 通过Voyager,我们不需要训练GP...

Read More
  1. Next Page