苹果、微软缩小AI模型以提升性能
talkingdev • 2024-06-28
423246 views
科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型(SLMs),苹果和微软引入的模型具有明显较少的参数,但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议,我们正在超越LLMs的时代,因为SLMs提供了如本地设备操作、为小型实体提供更大的可访问性以及潜在的对人类语言习得的洞察等优势。尽管规模较小,但在高质量或“教科书级别”的数据上训练SLMs也有助于提升其有效性。