漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

Fuyu-Heavy多模型表现超越Gemini Pro

talkingdev • 2024-01-26

684585 views

Adept公司扩大了其Fuyu架构并训练了一个更大的版本,目前是MMMU上排名第三的最佳模型之一。该模型在其他任务中也表现良好(例如,在HumanEval编码基准测试中达到40+)。与其他替代方案相比,扩展此架构的挑战较少,部分原因是其简单性。但是,数据I/O、内存带宽和自定义内核开发仍然存在挑战。

核心要点

  • Adept公司扩大了其Fuyu架构并训练了一个更大的版本,目前是MMMU上排名第三的最佳模型之一。
  • 该模型在其他任务中也表现良好。
  • 扩展此架构的挑战较少,部分原因是其简单性。

Read more >