漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-20 talkingdev

对齐更长更好

使用偏好数据对齐语言模型时,往往难以确定应该使用哪些示例。这项工作提出了一个出乎意料的稳健基准 - 选择1,000个最长的示例来进行对齐。

Read More