漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-22 talkingdev

Meta Reality Labs推出场景脚本3D场景重建技术

Meta Reality Labs最新研发的模型能够将视觉输入转换为场景的三维表示。这个拥有7000万个参数的模型能够在设备上快速运行,并且展现出极高的稳定性。这一技术的发展,不仅为虚拟现实和增强现实领域带来了新的突破,...

Read More
2024-03-21 talkingdev

通用一致性轨迹模型(GCTMs)助力提升图像编辑效率

近期,一项名为Generalized Consistency Trajectory Models(GCTMs)的新项目在GitHub上发布,该项目致力于通过引入一致性模型来增强扩散模型在图像编辑和恢复等任务上的能力。GCTMs通过简化处理流程,实现了通过单...

Read More
2024-03-21 talkingdev

FRESCO技术突破:提升视频翻译空间时间一致性

FRESCO是一种创新的方法,它通过结合帧内和帧间的对应关系,显著提高了视频翻译任务中的时空一致性。该技术通过分析视频帧之间的细微差异,实现了更为流畅和自然的翻译效果。FRESCO技术的出现,预示着视频内容在不同...

Read More
2024-03-21 talkingdev

论文:DreamDA利用扩散模型开创数据增强新方法

DreamDA提出了一种全新的数据增强技术,该技术通过扩散模型合成多样化、高质量的图像,这些图像与原始数据分布极为相似。数据增强在机器学习和深度学习领域中扮演着至关重要的角色,尤其在训练模型时,能够提高模型...

Read More
2024-03-21 talkingdev

GPT-5或于今年夏季发布,预计将大幅升级ChatGPT

据报道,OpenAI计划在今年2024年夏季发布一个重要的人工智能模型,可能是GPT-5。这个新模型预计是一个多模态大型语言模型,其功能与GPT-4相似,但性能更为优秀。目前,OpenAI仍在对该模型进行训练,训练完成后将进行...

Read More
2024-03-20 talkingdev

Quiet-Star:提升语言模型输出准确性的推理框架开源

Quiet-Star是一个推理框架,旨在增强语言模型生成正确输出的能力。该框架的代码已经公开,同时发布了一个每个令牌8步的模型。Quiet-Star通过优化模型的推理过程,提高了生成文本的准确性和相关性,对于自然语言处理...

Read More
2024-03-19 talkingdev

论文:视觉变换器技术助力水下机器人目标检测能力提升

最新研究项目YOLOX-ViT在水下机器人领域中引入了一种创新的目标检测方法,该方法通过整合视觉变换器(Visual Transformers)和知识蒸馏(Knowledge Distillation)技术,显著提高了目标检测的准确性和效率。该技术的...

Read More
2024-03-19 talkingdev

Stability AI发布Stable Video 3D,开创三维模型新纪元

Stability AI近日推出了基于Stable Video的新技术——Stable Video 3D。该技术能够通过单一图片生成3D模型,其性能超越了Stable Zero 123及其他现有方法。目前,Stable Video 3D的权重数据已经对外提供,旨在支持研究...

Read More
  1. Prev Page
  2. 23
  3. 24
  4. 25
  5. Next Page