偏好优化的相关内容 — 漫话开发者

一项最新研究显示，通过对开源大语言模型进行高效的微调，其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法，仅使用5400对偏好数据对GPT-OSS 120B模型进行训练，使其在RewardBench 2评估基准的人类偏好对齐任务上超越了GPT-5.2。这一成果不仅证明了开源模型在特定任务上的巨大潜力，更凸显了其显著的成本与效率优势：训练成本降低15倍，推理速度提升14倍。此外，如Qwen3 235B等其他开源模型也在数学和安全等领域展现出卓越性能。该进展意味着，企业与研究机构能够以更低的成本、更快的速度获得透明、可定制的高性能AI评判模型，从而减少对昂贵闭源方案的依赖，推动AI技术向更开放、更易获取的方向发展。