漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2024-01-17 talkingdev

Meta新技术,实现语音克隆和翻译无缝衔接

Meta最近展示了一项新的技术,可以实现语音克隆和翻译的无缝衔接。该技术使用深度学习和自然语言处理等技术,可以在不改变说话者声音和语调的情况下,将一种语言翻译成另一种语言。这种技术将为多语种交流和语言学习...

Read More
2024-01-12 talkingdev

Potis AI:利用AI技术实现自动化面试

近日,Potis AI在一场新品发布会上推出了一款基于人工智能技术的自动行为面试产品。该产品通过AI算法分析应聘者的语音、面部表情、姿态等信息,快速评估其职业素养、人际交往能力、团队协作能力等关键能力,大大提高...

Read More
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-12-07 talkingdev

谷歌通过SDXL技术实现图文风格一致性

谷歌最近基于SDXL技术推出了一项令人惊叹的工作,该工作通过多代人的注意力共享来维护一致的样式。这种方法至关重要的是不需要进行任何微调。

Read More
2023-11-29 talkingdev

360度全景成像混合技术实现开源

研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。

Read More
2023-10-26 talkingdev

Humane推出AI助手胸针,搭载GPT-4技术

Humane公司推出了一款AI助手胸针,可通过磁性吸附于衣物上,搭载了GPT-4技术。与其他AI助手不同,Humane的AI助手胸针注重保护用户隐私,不会记录、共享或出售用户的数据。通过GPT-4技术,Humane的AI助手胸针可以实现...

Read More
2023-10-25 talkingdev

噪声调度改进了视频扩散技术

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page