漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-10 talkingdev

Video-STaR:自我训练助力视觉语言模型的提升

Video Self-Training with augmented Reasoning (Video-STaR)是一种新的方法,用于改进大型视觉语言模型(LVLMs)。通过自我训练和增强推理,Video-STaR能够提高模型的学习能力和预测准确性。这种方法的主要优势在于...

Read More
2024-03-19 talkingdev

GroupContrast:重新定义自监督3D场景理解技术

最近,一个新的GitHub项目GroupContrast引起了技术界的广泛关注。该项目通过将片段分组与语义感知对比学习相结合,重新定义了自监督3D表示学习的概念。这种创新的方法不仅能够提高3D场景理解的准确性,还能够在不依...

Read More
2023-08-24 talkingdev

自我训练调查:机器学习新方向解析

半监督和自我监督学习是机器学习模型生成训练信号的地方。这与标准的监督、无监督和强化学习有所不同。目标函数通常是特定于数据的(例如,掩盖单词或旋转图像)。本研究深入探讨了在这个领域使用的常见技术和存在的...

Read More
2023-08-15 talkingdev

跨越激光雷达环境的3D检测差距:MS3D++自我训练系统开源

3D检测器在面对不熟悉的环境时常常会失败,由于工具、地点或天气的变化,导致检测率大幅下降。这个项目提出了一个自我训练系统,通过创建准确的假标签,MS3D++,来适应不同类型的激光雷达。无论是工具、地点或是天气...

Read More