MiniCMP-V开源新版本,可在手机上处理视觉任务
talkingdev • 2024-05-23
528221 views
近日,MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色,甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言,还在光学字符识别(OCR)和视觉问答(visual question answering)方面表现尤为突出。这一突破使得用户能够在手机上进行更强大和多样化的视觉处理任务,大大提升了移动设备的智能化水平。