Fuyu-Heavy多模型表现超越Gemini Pro

talkingdev • 2024-01-26

684585 views

Adept公司扩大了其Fuyu架构并训练了一个更大的版本，目前是MMMU上排名第三的最佳模型之一。该模型在其他任务中也表现良好（例如，在HumanEval编码基准测试中达到40+）。与其他替代方案相比，扩展此架构的挑战较少，部分原因是其简单性。但是，数据I/O、内存带宽和自定义内核开发仍然存在挑战。

核心要点

Adept公司扩大了其Fuyu架构并训练了一个更大的版本，目前是MMMU上排名第三的最佳模型之一。
该模型在其他任务中也表现良好。
扩展此架构的挑战较少，部分原因是其简单性。

Fuyu-Heavy多模型表现超越Gemini Pro

核心要点

Related posts