漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-14 talkingdev

WebLlama:基于网页浏览并本地问答的开源模型

WebLlama是一个设计精良的模型,能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集,或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练,使其能够更好地理解和处理网络信息...

Read More
2024-05-10 talkingdev

Buzz预训练数据集发布,更准确地理解和预测人类的行为和喜好

Buzz是一个创新型的数据集,它在预训练中融合了偏好数据。该数据集的研究者们还发布了几个利用这些数据训练的模型。他们发现,这些模型在许多人类偏好任务上表现出色。Buzz数据集的出现,无疑为人工智能研究提供了新...

Read More
2024-01-11 talkingdev

Mixtral of Experts论文发布

Mixtral论文已经发布。该论文没有讨论预训练数据集。大部分的内容都是众所周知的,但是在专家路由评估的讨论中有一个有趣的新见解。

Read More