漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-07 talkingdev

两位巨头谈AI未来:Reid Hoffman与Vinod Khosla

Reid Hoffman和Vinod Khosla的讲话持续了45分钟以上,涉及了从AI到“技术乐观主义”宣言等各种话题。两位巨头对未来的发展和科技行业的监管有着独到的见解。他们认为AI将会对整个社会产生深远的影响,而政府和企业需要...

Read More
2023-12-07 talkingdev

谷歌通过SDXL技术实现图文风格一致性

谷歌最近基于SDXL技术推出了一项令人惊叹的工作,该工作通过多代人的注意力共享来维护一致的样式。这种方法至关重要的是不需要进行任何微调。

Read More
2023-12-07 talkingdev

RGB-D视频中显著对象检测得到提升

这个GitHub仓库公布了两个重要贡献:RDVS数据集,包含丰富多样的RGB-D视频场景,以及DCTNet+,一种专门用于RGB-D视频对象检测的网络,配备了创新功能,以精确预测和改进现有模型的性能。

Read More
2023-12-07 talkingdev

使用扩散模型从单一视角生成3D图像

Zero123++是一个使用扩散原理从单个输入图像生成一致的多视图图像的模型。通过利用预训练的2D模型,Zero123++解决了纹理质量和对齐问题等挑战。

Read More
2023-12-07 talkingdev

DiffiT:基于扩散的视觉转换器生成高分辨率图像

该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...

Read More
2023-12-07 talkingdev

自学习语言模型实现领域自适应

在需要专业知识的领域中使用语言模型时,可以进行微调或使用某些检索技术。但两者都有缺点。这种新颖的方法使用自动生成的合成数据来更好地学习测试时的信息。它在标准适应基准测试中显示出比微调和RAG更好的表现。

Read More
2023-12-07 talkingdev

深入探讨:指令调优的最新进展

指令调优的引入大大提高了语言模型的实用性。近来,出现了许多新的进展,例如合成数据管道,使这一过程变得更好、更高效。

Read More
2023-12-07 talkingdev

3D高斯喷洒跟踪技术开源

高斯喷洒是一种令人惊叹的三维重建方法。在这种情况下,科学家们正在努力将COLMAP从他们的视觉映射和跟踪系统中移除。尽管结果令人信服,但仍需要进行一些重的计算。

Read More
  1. Prev Page
  2. 374
  3. 375
  4. 376
  5. Next Page