漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-15 talkingdev

Stable与Wurstchen发布新的文本到图像模型

Stable Cascade模型是一种新的仅用于研究的文本到图像模型,其在美学、提示忠实度和文本质量方面优于SDXL。它是使用Würstchen架构进行训练的,并具有多步架构,使调整变得容易。该模型的稳定性能够有效地提高图像生...

Read More
2024-02-15 talkingdev

亚马逊发布史上最大的文本转语音AI模型,拥有“新兴能力”

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

Read More
2024-02-14 talkingdev

苹果发布多模态LLM指导下的图像编辑代码

苹果发布了一款新的代码,使用多模态语言模型来改进人类提供的自然语言图像编辑。这个新的代码的核心思想是使用大型语言模型来指导用户对图像进行编辑,从而提高编辑的质量和效率。该代码的具体实现是将图像与自然语...

Read More
2024-02-14 talkingdev

Deepfake结合NeRFs和GS技术制作高度逼真的3D头像

近日,一篇名为《ImplicitDeepfake1》的论文在计算机图形学领域引起了广泛关注。该论文提出了一种新方法,将deepfake技术与Neural Radiance Fields(NeRFs)和Gaussian Splatting(GS)相结合,用于创建高度逼真的3D...

Read More
2024-02-13 talkingdev

质量人类数据探讨

本文主要讨论人类在数据生成中的作用。人类可以收集偏好数据、进行注释标记等,以提高数据的质量。随着机器学习和人工智能的发展,高质量的人类数据越来越受到重视。本文还探讨了如何让人类数据更加准确、可靠,同时...

Read More
2024-02-08 talkingdev

Laxta语言模型为巴斯克文提供支持

Laxta是一个新的自然语言处理公司,为巴斯克语提供了一套新的语言模型。该模型使用了大约40亿个单词的语料库,并经过了特别调整,以更好地支持巴斯克语言。这种语言模型的使用可以提高文本生成、机器翻译、对话系统...

Read More
2024-02-08 talkingdev

AI时代的工业革命

随着AI工具和商业用例变得越来越复杂,我们将开始看到越来越多的技术应用于现实世界。一个看待这个机会的角度是,人工智能将使流程更加便宜高效,同时大大提高利润率。这可能会开启一种全新的做事方式,以前由于利润...

Read More
2024-02-08 talkingdev

论文:新工具解决多模态LLM中的幻觉问题

针对多模态大语言模型(MLLM)中的幻觉问题,研究人员开发了MHaluBench,一个新的评估幻觉检测方法的基准。该工具可以帮助研究人员更好地评估语言模型的幻觉能力,从而有效提高模型的质量和准确性。目前,该工具已经...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page