漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-28 talkingdev

重塑旅行者1号:NASA的星际探测器重新获得通讯能力

经过五个月的远程故障排除,工程师们部分地恢复了NASA旅行者1号航天器上1970年代的计算机。旅行者1号正在以超过150亿英里的距离离开地球,因此工程师上传一个指令并获得响应几乎需要两天的时间。该航天器在去年11月...

Read More
2024-04-04 talkingdev

Bluedot 1.1:打造智能跟进邮件工具,整合Google Meet会议精华

Bluedot 1.1是一款全新的智能跟进邮件工具,它能够从Google Meet会议中提取关键信息,帮助用户快速生成后续邮件。这一创新产品不仅节省了用户整理会议记录的时间,还提高了邮件撰写的效率。Bluedot 1.1通过先进的自...

Read More
2024-04-01 talkingdev

VoiceCraft项目发布:700M参数模型实现零样本语音克隆与合成

近期,一项名为VoiceCraft的开源项目在GitHub上引起了广泛关注。该项目通过一个强大的700M参数模型,实现了零样本(Zero shot)的语音克隆和语音合成功能。这意味着用户无需进行任何额外的训练,就能够利用该模型复...

Read More
2024-03-20 talkingdev

MineDreamer:AI在Minecraft世界的指令执行Agent

MineDreamer是一款AI代理,它通过结合先进的语言和视觉模型,擅长在Minecraft世界中执行复杂的指令。这一创新技术使得AI能够更好地理解玩家的意图,并在游戏中实现精准的操作。MineDreamer的成功不仅仅是在执行指令...

Read More
2024-02-12 talkingdev

Miracode:Minecraft字体的可读版本现已在GitHub上开源

Miracode是基于Minecraft UI字体的Monocraft字体的可读版本。 这个开源项目具有更好的可读性和更多的字形,可以在开发和设计中使用。 这个开源项目已经在GitHub上发布,供所有人使用。Miracode的发布标志着Minecraft...

Read More
2023-11-10 talkingdev

开源MusicGen升级至立体声生成

Audiocraft MusicGen是一款强大的将文本转化为音乐的人工智能模型。最新升级的版本现在支持立体声生成,通过巧妙地交叉使用左右声道进行微调,提高了整体音乐体验。虽然这一升级并没有提高基准分数,但它能够更好地...

Read More
2023-10-16 talkingdev

ScaleCrafter: 高分辨率图像生成技术开源

研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。

Read More
2023-08-03 talkingdev

Meta发布AudioCraft:一站式生成音频需求的代码库

Meta最新发布的AudioCraft,是一款满足所有生成音频需求的一站式代码库,包括音乐、音效和压缩。AudioCraft的出现,改变了过去我们需要使用多个工具和平台才能完成的音频生成任务,现在只需要这个代码库,就能轻松完...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page