CPO策略提高翻译语言模型的能力

talkingdev • 2024-01-21

698916 views

该项目提出了对比优化策略(CPO)，以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型，解决了监督微调的局限性，并取得了改进。CPO策略通过对模型的预训练进行增量式微调，有助于提高机器翻译的翻译质量。