漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-02 talkingdev

Figma AI:AI驱动的设计工具新选择

Figma AI是一套新的AI驱动工具,为Figma设计师提供了诸如视觉搜索、素材搜索、文本编辑、图像编辑、原型制作、图层重命名以及设计生成等功能。这些特性由第三方AI模型驱动,且在β测试期间是免费使用的。Figma AI的推...

Read More
2024-04-10 talkingdev

SwapAnything:图片内容随意替换精准无缝融合

SwapAnything是一项革命性的新技术,能够在图像中任意替换对象,同时保持图片其余部分不变。与传统工具相比,SwapAnything的优势在于它可以替换任何对象,而不仅限于主要焦点。此外,它在将新对象自然融入原始图像方...

Read More
2024-04-08 talkingdev

DALL-E与ChatGPT实现整合,图像编辑功能登陆三大平台

OpenAI宣布其创新性AI图像生成模型DALL-E现已成功与聊天机器人ChatGPT整合。这一新功能的推出使得用户能够在网页版、iOS以及Android平台上直接编辑DALL-E生成的图像。DALL-E此前已因其惊人的图像创造能力而名声大噪...

Read More
2024-04-04 talkingdev

DALL-E图像编辑功能现已集成至ChatGPT

OpenAI的DALL-E现已推出图像编辑工具,支持网页和移动端使用。用户可以使用预设的风格建议来激发图像创作灵感。这一图像生成平台已经与ChatGPT集成,用户可以在网页、iOS和Android上的ChatGPT中编辑DALL-E生成的图像...

Read More
2024-03-25 talkingdev

论文:开放词汇注意力图谱革新图像分割技术

开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...

Read More
2024-03-21 talkingdev

通用一致性轨迹模型(GCTMs)助力提升图像编辑效率

近期,一项名为Generalized Consistency Trajectory Models(GCTMs)的新项目在GitHub上发布,该项目致力于通过引入一致性模型来增强扩散模型在图像编辑和恢复等任务上的能力。GCTMs通过简化处理流程,实现了通过单...

Read More
2024-02-16 talkingdev

文本驱动的图像编辑无需蒙版

研究人员开发了一种基于文本提示进行图像编辑的独特方法。这种方法使用文本到图像模型和边界框生成器来识别需要编辑的区域,从而无需蒙版或草图即可进行更改。该方法可实现文本驱动的图像编辑,可以大大提高图像编辑...

Read More
2024-02-14 talkingdev

苹果发布多模态LLM指导下的图像编辑代码

苹果发布了一款新的代码,使用多模态语言模型来改进人类提供的自然语言图像编辑。这个新的代码的核心思想是使用大型语言模型来指导用户对图像进行编辑,从而提高编辑的质量和效率。该代码的具体实现是将图像与自然语...

Read More
2024-02-14 talkingdev

苹果推出MGIE,一款革命性的AI模型,用于基于指令的图像编辑

苹果推出了一款名为MGIE的开源AI模型,用于图像编辑,使用多模态大语言模型来解释文本指令并执行像素级编辑。这种模型可以将人类语言翻译成图像编辑操作,例如“使图像更亮”或“添加红色滤镜”。苹果表示,MGIE的目的是...

Read More
2024-01-31 talkingdev

论文:AI改写艺术图像编辑

CreativeSynth是一种艺术图像编辑方法,通过无缝集成文本和图像输入来实现。其扩散模型配备了定制化的注意机制,能够精确地处理风格和内容,同时保留原始艺术作品的本质。为艺术家和设计师提供了一个全新的创作维度...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page