漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Llava 1.6发布,OCR、推理和世界知识得到改进

talkingdev • 2024-02-02

664163 views

Llava是一种视觉语言模型,最新版本为1.6,经过改进后,其OCR、推理和世界知识等方面有了很大提升,甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型,以便更多人能够使用。

核心要点

  • Llava 1.6发布,视觉语言模型得到改进。
  • Llava 1.6版本的OCR、推理和世界知识等方面有了很大提升。
  • Llava团队计划发布数据、代码和模型,以便更多人能够使用。

Read more >