漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

MiniCMP-V开源新版本,可在手机上处理视觉任务

talkingdev • 2024-05-23

344776 views

近日,MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色,甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言,还在光学字符识别(OCR)和视觉问答(visual question answering)方面表现尤为突出。这一突破使得用户能够在手机上进行更强大和多样化的视觉处理任务,大大提升了移动设备的智能化水平。

image

核心要点

  • MiniCMP-V发布新版本,基于Llama 3训练
  • 支持30种语言,提升OCR和视觉问答性能
  • 性能超越多款闭源的专有模型

Read more >