漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

GeneFace++:实时音频驱动的三维说话人生成技术

talkingdev • 2023-06-02

1370106 views

近日,研究人员开发出了一项名为GeneFace++的技术,可以实现实时音频驱动的三维说话人生成。该技术的出现,让数字化的说话人物变得更加逼真,与任何语音音频同步。 GeneFace++的诞生,主要是为了解决数字世界中创造逼真的说话人物的挑战。该技术通过改进唇形同步、视频质量和系统效率的方法,成为第一种实现实时说话人生成的技术。 以下是该技术的核心特点: - 实现实时音频驱动的三维说话人生成; - 改进唇形同步和视频质量; - 提高系统效率。 该技术的研究为数字娱乐、虚拟现实、智能客服等领域提供了新的应用可能性。