漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-14 talkingdev

论文:利用2D扩散模型对3D网格进行图像风格化

这项研究提出了3DStyle-Diffusion模型,这是一种用于对3D网格进行细节风格化的新方法,整合了2D扩散模型以增加对外观和几何形状的控制。它通过首先使用隐式MLP网络将3D网格的纹理参数化为反射和照明,然后使用预训练...

Read More
2023-11-10 talkingdev

论文:自动驾驶车辆的地标匹配技术有新突破

自动驾驶汽车的地标匹配是一项重要的技术,其能力直接关系到自动驾驶汽车的定位和导航精度。近日,研究人员提出了一种名为RobustMat的新方法,通过使用空间信息和神经微分方程,改进了自动驾驶汽车在不同条件下匹配...

Read More
2023-11-08 talkingdev

利用LLM提高推荐系统精度的新方法

近日,研究人员提出了一种名为CLLM4Rec的全新方法,该方法通过高级预训练和新型语言嵌入,将大型语言模型与基于ID的系统相结合,提高了推荐精度。研究人员表示,CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...

Read More
2023-11-01 talkingdev

自我监督去噪新方法PUCA开源

近日,一项名为PUCA的自我监督去噪新方法在GitHub上发布。该研究对于有效去噪保持J不变性是一个至关重要的方面。研究人员表示,PUCA的特点在于其利用了无噪声图像的自我监督来训练,从而可以在保持图像质量的同时去...

Read More
2023-10-25 talkingdev

AgentTuning:通过多个智能体任务中的交互轨迹来调整LLMs

近日,研究人员开源了名为AgentTuning的GitHub仓库。该仓库提供了一种新的方法来调整语言模型。这种方法通过多个智能体任务中的交互轨迹来训练和调整语言模型,从而更好地适应不同的任务和场景。这种方法可以提高语...

Read More
2023-10-24 talkingdev

新的方法提高目标定位精度

弱监督目标定位通过仅使用简单的图片标签来查找物体。新的背景激活抑制(BAS)方法通过专注于图片的重要部分并忽略其余部分来实现更好的效果,在多个数据集上展现了惊人的结果。

Read More
2023-10-19 talkingdev

MonoSKD开源,一张图像实现3D物体检测

MonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...

Read More
2023-10-17 talkingdev

Ex-MCR:无配对数据的多模态学习方法

这项研究介绍了一种名为Ex-MCR的新方法,该方法可以有效地学习多个模态的统一对比表示,而无需配对数据。通过对齐现有的多模态对比表示,Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page