生成模型的相关内容 - 漫话开发者

2024-07-11 talkingdev

Paints UNDO：模拟绘画过程，UNDO生成模型开源

来自ControlNet、IC-Light等图像生成系统的创建者，发布了名为Paints UNDO的系统，它是一个模型创建笔触以重建图像的系统。与以往的笔触系统不同，该模型可以撤消笔触，并且在进行过程中经常完全重新思考其方法，这...

2024-07-10 talkingdev

OccSora是一种基于扩散的4D占用生成模型，旨在改善长期的时间演变。这种模型是一种新颖的方法，可以生成时间和空间的占用，并且具有超前思考的能力。OccSora的引入将使驾驶场景的预测变得更为准确和实时，从而提高驾...

2024-07-08 talkingdev

近日，Tongyi语音团队发布了他们的最新成果，一套超强的音频理解与生成模型。这套模型的发布，无疑将大大推动音频技术的发展与进步。模型的理解部分，能够准确分析出音频中的各种元素和信息，包括但不限于音质、音色...

2024-07-02 talkingdev

Mistral Codestral和GPT-4o最近被添加到了Jupyter Notebooks中。Mistral Codestral是一种新型的代码编辑器，它可以提高代码的编写速度和质量，而GPT-4o是一种新型的文本生成模型，可以生成更加精准和自然的文本。这...

2024-06-26 talkingdev

近日，AI与Morph Labs联合发布了一篇关于信息检索增强型生成（RAG）模型微调的优秀博客文章。在文章中，他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型，它结合了信息检索技术...

2024-06-26 talkingdev

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同，EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是，EvalAlign不...

2024-06-11 talkingdev

苹果在全球开发者大会（WWDC）的主题演讲中宣布了一系列AI特性和其操作系统的重大更新。其中，Apple的AI系统Apple Intelligence将为iPhone、iPad和Mac带来强大的生成模型，作为核心功能。这将使Apple的原生应用程序...

2024-06-04 talkingdev

MeshXL是一款全新的3D网格生成模型，能够生成高质量的3D网格。这款模型利用先进的算法和深度学习技术，显著提升了网格生成的精度和效率。MeshXL的推出意味着在游戏开发、虚拟现实和计算机图形学等领域，3D模型的创建...

2024-06-03 talkingdev

Mora是一款创新的视频生成模型，它利用多个视觉AI代理，旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统，这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

2024-05-17 talkingdev

在技术领域，一种名为MasterWeaver的新方法被提出，以提高个性化文本到图像生成模型的性能。这种技术的出现，无疑为AI领域的图像生成技术开辟了新的可能性，使得文本到图像的转换过程更为精确和个性化。MasterWeaver...