质量的相关内容 - 漫话开发者

2023-06-02 talkingdev

GeneFace++：实时音频驱动的三维说话人生成技术

近日，研究人员开发出了一项名为GeneFace++的技术，可以实现实时音频驱动的三维说话人生成。该技术的出现，让数字化的说话人物变得更加逼真，与任何语音音频同步。 GeneFace++的诞生，主要是为了解决数字世界中创造...

2023-06-01 talkingdev

今天，Siit AI宣布了其基于GPT-4的内部知识库解答机器人的发布，该机器人可以通过Slack和Teams直接回答所有员工的问题。以下是这一发布的三个核心要点： - Siit AI是一种基于人工智能的机器人，能够立即回答所有员...

2023-06-01 talkingdev

利用预训练的图像-文本扩散模型和生成对抗网络（GAN）进行训练，作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型，我们可以创建各种风格的多视角头像图像，从而实现多样性。 ## 核...

2023-05-31 talkingdev

ProlificDreamer是一种提高文本到3D图像生成效果的新方法。它通过将3D参数视为随机变量来解决文本到3D生成中早期Score Distillation Sampling（SDS）方法中存在的过度饱和和低多样性等问题。这种变分Score Distillat...

2023-05-26 talkingdev

加拿大音乐人及AI音乐倡导者Grimes最近花时间对AI生成的Grimes歌曲进行了评论，她发现这些歌曲非常出色。以下是本次评论的三个核心要点： - AI生成的音乐质量不断提高，这些歌曲和她自己创作的歌曲一样优秀。 - 通...

2023-05-25 talkingdev

SEAHORSE是一个数据集，用于评估多语言摘要系统的质量。该数据集包含96,000个摘要，这些摘要已经根据六个重要方面（清晰度、重复、语法、归因、主要观点和简洁性）由人类进行了评分。这个数据集不仅可以作为自动化...

2023-05-25 talkingdev

2023-05-19 talkingdev

近日，研究人员开发出一种名为FastComposer的新方法，能够快速创建个性化的多主题图像，避免了其他方法中耗时的微调。不仅如此，FastComposer还能够处理多主题生成中的混合问题，并且可以更快地生成不同风格、动作和...