漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-26 talkingdev

通过被动摄像头增强深度估计的研究

这项研究提出了一种在被动摄像头中模拟主动立体感的方法,而无需使用物理图案投影仪。研究人员通过利用外部传感器的深度数据虚拟叠加图案,克服了传统设置的局限性。这种方法在各种数据集上都增强了立体算法和深度学...

Read More
2023-09-22 talkingdev

通过扩展UNet优化稳定扩散的生成质量

稳定扩散是一种复杂的技术,其可大幅度提高生成质量,而无需进行额外的训练。这是通过巧妙地调整权重和在UNet中扩大残差来实现的。具体的代码将在不久后公布。UNet是一种广泛应用于图像分割的深度学习框架,其独特的...

Read More
2023-09-18 talkingdev

SPDTransNet开源,应用Transformers进行更深入的睡眠分析

变压器是一种智能算法,通常用于处理文本或图像。这个项目调整了它们,使其能够与EEG数据一起工作,以更好地理解睡眠阶段。变压器的这种新应用打开了一个新的可能性,即通过使用复杂的深度学习模型来解决健康问题,...

Read More
2023-09-15 talkingdev

开源新数据集助力识别伪造名人照片

DeepFakeFace (DFF) 是一个由先进技术生成的伪造名人照片的集合,旨在帮助我们更好地区分真实照片和伪造的照片。这个数据集集合了大量的伪造名人照片,这些照片的制作都运用了尖端的科技,如深度学习和人工智能等,...

Read More
2023-09-15 talkingdev

使JPEG与深度学习的优化相得益彰

JPEG图像无处不在,但由于在训练过程中无法轻松调整,所以它们与深度学习的兼容性并不好。这个项目回顾了现有的解决方案,并提出了一种新的方法,可以解决这些问题,使JPEG图像完全可调整且与深度学习系统兼容。JPEG...

Read More
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-09-13 talkingdev

论文:人工智能获得嗅觉,准确识别气味

科研人员成功训练出一个模型,通过使用自定义的数千种手动标记分子的数据集训练图神经网络,使其能够准确地识别气味。这是人工智能在模拟人类感知能力方面的一次重大突破,标志着人工智能在感知世界的能力上迈出了新...

Read More
2023-09-11 talkingdev

在浏览器中运行现代深度学习模型——Web AI

随着技术的成熟,WebAssembly的热度逐渐降低。现在,WebAssembly已经足够好,可以在很多生产场景中使用,包括基于浏览器的模型部署。Web AI是一个GitHub仓库,它允许在浏览器中运行现代深度学习模型,这标志着WebAss...

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page