漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-15 talkingdev

使JPEG与深度学习的优化相得益彰

JPEG图像无处不在,但由于在训练过程中无法轻松调整,所以它们与深度学习的兼容性并不好。这个项目回顾了现有的解决方案,并提出了一种新的方法,可以解决这些问题,使JPEG图像完全可调整且与深度学习系统兼容。JPEG...

Read More
2023-09-12 talkingdev

论文:更好理解和推理图片的新方法研究

本研究的作者们已经创建了一种方法,用以测试视觉语言模型对于他们所看到的内容进行逻辑思考的能力。视觉语言模型是一种结合了计算机视觉和自然语言处理的技术,它能理解和解释图片中的内容。然而,这种模型在理解和...

Read More
2023-09-12 talkingdev

无需草稿模型,加速推测解码的新方法

语言模型推理通常较慢,因为这些模型的运行严重依赖内存。为了解决这一问题,人们引入了使用较小的草稿模型进行推测性解码,以“提前”提供给大模型的建议。这种方法效果不错,但实现起来复杂,且寻找一个好的草稿模型...

Read More
2023-09-11 talkingdev

通过一张照片,精准定位篮球在3D空间的位置

本研究的作者们开发了一种新方法,只需要一张照片,就能准确地确定篮球在3D空间中的位置。这对于体育分析和机器人技术等领域来说,具有重大意义。对于传统的3D定位技术,通常需要多个相机或传感器才能实现精确定位,...

Read More
2023-09-07 talkingdev

一种新方法:3D视角下判断两张相似图片是否完全一致

一种名为'影子分身'的新型科技工具,能够帮助我们判断两张看似相同的图片是否展示的是同一3D对象。这种工具足够智能,可以避免人们可能会犯的错误。它的工作原理是根据3D模型的特点,通过分析图片之间的微小差异,进...

Read More
2023-09-04 talkingdev

多视角扩散的3D生成技术:全局一致性与语义连贯性的新突破

近期,3D生成方法的研究领域又有新进展。这次的新方法,生成出的网格模型在全局上具有一致性,并且在语义上呈现出连贯性。更令人兴奋的是,这项技术还有极大的加速优化空间。通过采用多视角扩散的方法,3D模型生成技...

Read More
2023-08-31 talkingdev

轻量级图像增采样器DySample,提升图像分辨率新思路

传统的提升图像分辨率方法,如CARAFE和SAPA,常常需要大量的计算资源,并且其应用领域存在限制。而DySample作为一种更简洁、更高效的方式,已在各种图像任务中展现出良好的性能。相较于传统方法,DySample的优势在于...

Read More
2023-08-31 talkingdev

Spatio-Temporal,一种提升3D人体姿态检测的新方法开源

现有的理解3D人体姿态的方法主要关注的是身体各部分在空间中的关系,但往往忽略了它们随着时间的变化。这种新方法同时考虑了空间和时间,使其在理解姿态方面,特别是身体某些部分被遮挡或不清晰的时候,表现得更为优...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page