生成模型的相关内容 - 漫话开发者

2024-06-03 talkingdev

Mora：挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型，它利用多个视觉AI代理，旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统，这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

2024-05-17 talkingdev

在技术领域，一种名为MasterWeaver的新方法被提出，以提高个性化文本到图像生成模型的性能。这种技术的出现，无疑为AI领域的图像生成技术开辟了新的可能性，使得文本到图像的转换过程更为精确和个性化。MasterWeaver...

2024-05-13 talkingdev

Lumina是一个新一代的项目，其目标是成为统一的文本到X生成模型。这个项目的训练涉及到图像、视频、音频和文本的交替，这种方法提高了下游性能。Lumina项目带来的这种全新技术，将对未来的人工智能、机器学习和深度...

2024-05-09 talkingdev

ChemFlow是一个新的框架，旨在通过使用深度生成模型高效地导航化学空间，从而提高分子科学的效率。这种新型框架的出现，使化学研究人员能够在化学空间中更加精准地进行探索和导航，从而为分子科学领域的研究和发展开...

2024-04-30 talkingdev

StoryDiffusion是一项新的机器学习技术，可用于生成具有长距离相关性的图像和视频。它使用了一种称为StoryGAN的生成模型，可以根据输入的故事情节和场景描述生成相关的图像和视频。这项技术有助于解决传统图像和视频...

2024-04-29 talkingdev

研究人员近日推出了一种名为PLLaVA的新模型，该模型通过采用独特的池化策略，使得图像-语言人工智能模型能够适应视频任务。在众多已有的图像-语言模型中，PLLaVA以其全新的应用方式和技术策略，展现出了强大的潜力和...

2024-04-28 talkingdev

Sakana AI近日发布了EvoSDXL-JP，这是一款为日语指令优化的高速图像生成模型，采用了一种革新的模型融合方法。与现有模型相比，EvoSDXL-JP的推断速度提高了十倍，并且性能卓越。这款模型非常适合在日本的教育领域使...

2024-04-16 talkingdev

本文深入探讨了如何训练扩散模型以生成视频，如何适配图像模型，甚至在无需额外训练的情况下，如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型，已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...