漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-22 talkingdev

利用真实世界知识提升语言模型表现:新的微调方法

研究人员设计了一种新方法,使用虚拟模拟器为语言模型提供“具身体验”,以培养其对真实世界的理解和规划能力。这种新方法显著提高了模型的能力,使得小型模型的表现与 ChatGPT 等大型模型相当甚至更好。 ## 三个核心...

Read More
2023-05-19 talkingdev

FastComposer:高效个性化的多主题文本到图像生成技术

近日,研究人员开发出一种名为FastComposer的新方法,能够快速创建个性化的多主题图像,避免了其他方法中耗时的微调。不仅如此,FastComposer还能够处理多主题生成中的混合问题,并且可以更快地生成不同风格、动作和...

Read More
2023-05-18 talkingdev

神秘巨型AI模型之谜终被解开:Boundless DAS揭示其中奥秘

近日,Boundless DAS是一种新方法,我们开发了它,以更好地理解像Alpaca这样的大型AI模型的内部机制,寻找其行为中可理解的模式。我们发现,Alpaca通过以一种一致的方式使用两个可理解的变量来解决一个简单的数字问...

Read More
2023-05-12 talkingdev

用AI和素描创造更好的视频内容

近日,有一篇论文介绍了一种使用人工智能(AI)和文本生成视频内容的新方法。这种方法将两种技术——Text-to-Video Zero和ControlNet结合在一起,可以创建高质量的、与用户意图非常接近的一致性视频,多次实验证明其效...

Read More
2023-05-08 talkingdev

Otter模型推出新方法MIMIC-IT,改善AI系统的指令理解能力(GitHub代码库)

研究人员推出了一种新的方法,称为MIMIC-IT,用于改善像Otter这样的模型在不同情境下(包括图像和文本)理解和遵循指令的能力。通过使这些模型更易于使用,研究人员可以更轻松地创建更好的AI系统。 ### 核心要点 -...

Read More
2023-05-03 talkingdev

科技新闻:实时照片真实肖像头像生成器

近日,研究人员开发出一种名为StyleAvatar的新方法,能够生成高保真的人像头像,并且能够控制表情变化。该方法采用了不同的网络组合,并结合了新的技术,如滑动窗口增强方法和预训练策略,生成了高质量的人像视频,...

Read More
2023-04-18 talkingdev

Soundini:自然视频编辑的声音引导扩散技术

## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26