漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

用提示增强的视觉语言模型开源

talkingdev • 2024-01-09

733559 views

这项项目介绍了一种方法,可以适应各种任务的类似CLIP的视觉语言模型,同时保留其泛化能力。该方法从LLM数据中学习提示,避免了需要标记图像的需求。

核心要点

  • 介绍了适应各种任务的视觉语言模型
  • 保留了模型的泛化能力
  • 通过自学习提示,避免了需要标记图像的需求

Read more >