漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

cola,利用视觉语言模型增强视觉推理

talkingdev • 2023-10-25

952430 views

Cola是一个使用大型语言模型来协调各种视觉语言模型(VLM)以改进视觉推理的系统。该代码库已经在GitHub上发布。

核心要点

  • Cola使用大型语言模型来协调各种VLM
  • Cola可以改进视觉推理
  • 该代码库已经在GitHub上发布

Read more >