漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-09-11 talkingdev

利用Segment Anything模型对医疗图像分割的改进

Segment Anything模型(SAM)对于常规图像的处理效果显著,但对于医疗图像的处理效果却不尽如人意。为此,研究者们创建了SAM-Med2D,这是通过在大量医疗图像上训练SAM并提供各种输入信息得到的。这种新模型在处理医...

Read More
2023-09-01 talkingdev

论文:用文本调制技术提升图像生成质量

仅从少数样本中产生多样化的图像一直是技术上的挑战。而新的技术——TexMod,采用独特的技术方法,将各种图像的细节融合在一起,并确保生成的图像具有逻辑性的布局。TexMod的出现,不仅提升了图像生成的质量,也为图像...

Read More
2023-08-31 talkingdev

轻量级图像增采样器DySample,提升图像分辨率新思路

传统的提升图像分辨率方法,如CARAFE和SAPA,常常需要大量的计算资源,并且其应用领域存在限制。而DySample作为一种更简洁、更高效的方式,已在各种图像任务中展现出良好的性能。相较于传统方法,DySample的优势在于...

Read More
2023-08-31 talkingdev

全面医疗图像分割:挑战与突破

医疗图像分割是一个将图像中每个像素识别为特定类别(如癌症与非癌症)的过程。在历史上,将一个模型转移到另一个任务一直是个巨大的挑战。然而,最新的研究展示了一个强大的模型,该模型仍基于不朽的UNet,可应用于...

Read More
2023-08-29 talkingdev

Meta AI发布基于虚幻引擎的超真实图形数据集

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG:动物,用于评估图像分类器鲁棒性的PUG:ImageNet,以及用于视觉语言模型评估的PUG:SPAR。这些数据集的发...

Read More
2023-08-24 talkingdev

MidJourney推出图像修复新功能

近日,MidJourney宣布推出其最新的功能“Vary (Region)”。该新功能允许用户进行图像修复——一种可以编辑图像画布内元素的过程。用户现在可以利用这项新技术,进行图像编辑和重构,无论是去除图像中不需要的元素,还是...

Read More
2023-08-18 talkingdev

3D图像的优化:新型关键点识别技术

关键点检测就像在图片中找到特定的点,以创建3D图像。一项名为DeDoDe的研究以全新、更优的方式找到这些点,确保他们在不同的视角中匹配,并提升3D图像的创建质量。关键点的定位和识别在3D图像的构建过程中起着至关重...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page