漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-02 talkingdev

GeneFace++:实时音频驱动的三维说话人生成技术

近日,研究人员开发出了一项名为GeneFace++的技术,可以实现实时音频驱动的三维说话人生成。该技术的出现,让数字化的说话人物变得更加逼真,与任何语音音频同步。 GeneFace++的诞生,主要是为了解决数字世界中创造...

Read More
2023-06-01 talkingdev

Siit AI发布:基于GPT-4的内部知识库解答机器人

今天,Siit AI宣布了其基于GPT-4的内部知识库解答机器人的发布,该机器人可以通过Slack和Teams直接回答所有员工的问题。以下是这一发布的三个核心要点: - Siit AI是一种基于人工智能的机器人,能够立即回答所有员...

Read More
2023-06-01 talkingdev

使用GitHub仓库创建时尚3D头像

利用预训练的图像-文本扩散模型和生成对抗网络(GAN)进行训练,作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型,我们可以创建各种风格的多视角头像图像,从而实现多样性。 ## 核...

Read More
2023-05-31 talkingdev

Github项目ProlificDreamer提升文本到3D图像生成效果

ProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling(SDS)方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...

Read More
2023-05-26 talkingdev

AI音乐倡导者Grimes对AI生成的Grimes歌曲进行评论

加拿大音乐人及AI音乐倡导者Grimes最近花时间对AI生成的Grimes歌曲进行了评论,她发现这些歌曲非常出色。以下是本次评论的三个核心要点: - AI生成的音乐质量不断提高,这些歌曲和她自己创作的歌曲一样优秀。 - 通...

Read More
2023-05-25 talkingdev

SEAHORSE:一种评估多语言摘要系统的工具

SEAHORSE是一个数据集,用于评估多语言摘要系统的质量。该数据集包含96,000个摘要,这些摘要已经根据六个重要方面(清晰度、重复、语法、归因、主要观点和简洁性)由人类进行了评分。这个数据集不仅可以作为自动化...

Read More
2023-05-19 talkingdev

FastComposer:高效个性化的多主题文本到图像生成技术

近日,研究人员开发出一种名为FastComposer的新方法,能够快速创建个性化的多主题图像,避免了其他方法中耗时的微调。不仅如此,FastComposer还能够处理多主题生成中的混合问题,并且可以更快地生成不同风格、动作和...

Read More
  1. Prev Page
  2. 46
  3. 47
  4. 48
  5. Next Page