生成模型的相关内容 - 漫话开发者

2024-01-31 talkingdev

论文：AI模型手部图像生成能力得到优化

研究人员通过在训练手部注释图像中添加三个额外通道，改善了生成模型（例如GAN和扩散模型）创建逼真手部图像的能力。这种方法利用了手部形态的先验知识，可以应用于许多手部相关的任务，例如手语翻译和手势识别。此...

2024-01-25 talkingdev

最近，一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据，让人们更好地了解这些模型的优势和不足。据悉，该排行榜是由...

2024-01-25 talkingdev

Prompt工程只是软件工程的一部分。Prompt是用自然语言编写的小程序。通过巧妙地使用词汇来猜测正确的'函数调用'，因为API未指定且在模型之间变化巨大，这是游戏的重要部分。将Prompt视为代码，允许Prompt工程师为喜...

2024-01-22 talkingdev

Meta最近推出了一系列令人难以置信的音乐和声音生成模型，并发布了推理代码。这些模型是通过机器学习训练的，可以生成高质量的音乐和声音效果。该公司表示，这些模型可以用于广泛的应用场景，包括游戏声音、虚拟现实...

2024-01-22 talkingdev

HuggingFace于近日发布了Haiku DPO数据集，旨在帮助AI模型写出正确的日本俳句。该数据集由多位专业诗人参与标注，包含数千条俳句及其正确的音律和形式，涵盖了从传统到现代的各个风格。据悉，该数据集可以用于训练和...

2024-01-21 talkingdev

AlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性，如在CodeContests数据集上所展示的。

2024-01-16 talkingdev

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度，并采用ControlNet样式提示实现更好的控制。

2024-01-11 talkingdev

研究人员开发了一种新的文本到3D生成模型的评估指标，解决了当前单一标准指标的局限性。这种先进的方法使用GPT-4V来创建提示并比较3D资产。它与人类偏好密切相关，并通过适应各种用户定义的标准来提供多样性。