漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-27 talkingdev

论文:研究人员推出基于分类器引导的图像个性化扩散模型

研究人员提出了一种新的方法,通过使用分类器引导来定制扩散模型,从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同,这种技术利用分类器引导扩散模型,无需额外的训练。此方法...

Read More
2024-05-24 talkingdev

Mp3tag - 通用标签编辑器

Mp3tag是一款功能强大的通用标签编辑器,可让用户轻松编辑和管理音频文件的元数据。它支持几乎所有主流音频格式,包括MP3,FLAC,OGG,WMA,M4A和WAV等。用户可以添加,编辑或删除歌曲的标题,艺术家,专辑,年份,...

Read More
2024-05-21 talkingdev

Art 3D:基于文本引导的高斯分布艺术场景生成技术

生成艺术性的二维图像是人工智能的一项有趣且富有创意的应用。这项工作通过高斯分布技术,将这一能力扩展到三维场景,并通过文本输入进行引导。高斯分布技术能够更加精准地捕捉和渲染三维空间中的细节,使得生成的3D...

Read More
2024-05-21 talkingdev

Art3D:高斯喷射技术引领文本指导的艺术场景生成

人工智能在生成艺术2D图像方面的运用早已让人们感到趣味盎然和富有创造力。而这项新的工作,将这种能力扩展到了3D领域,通过高斯喷射技术,以文本输入作为导向,使艺术场景生成更上一层楼。这种技术的出现,无疑为艺...

Read More
2024-05-16 talkingdev

IC-Relight:开源AI重照明工具,图像光照效果大幅提升

GitHub上最新的AI项目IC-Relight,是一款使用前景分离和文本调节的AI重照明工具,能带来极其强大的结果。该工具利用AI技术,将图像分为前景和背景,然后通过文本调节,实现对图像的精细控制和调整。这种方法的应用,...

Read More
2024-05-10 talkingdev

ElevenLabs预览音乐生成AI模型

人工智能初创企业ElevenLabs正在预览一种新模型,该模型可以将提示转化为歌词。该公司使用的推广策略与OpenAI为Sora AI使用的策略类似。这种新型AI模型的出现,预示着AI在音乐创作领域的应用可能会有很大的突破。Ele...

Read More
2024-05-08 talkingdev

任天堂承诺将在2025年4月之前推出Switch 2

任天堂总裁表示,下一代Switch控制台将在本财年内宣布。

Read More
2024-05-03 talkingdev

StreamMultiDiffusion开源,实时交互式图像创作

近日,一个名为StreamMultiDiffusion的新框架在GitHub上开源,该框架能够实现实时的区域性文本到图像的生成。这是一项突破性的技术,可以将文本信息实时转换为图像,显著提高了图像生成的效率和便利性。无论是在设计...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page