训练模型的相关内容 - 漫话开发者

2024-01-24 talkingdev

自我提升AI：通过选择独特数据的DiverseEvol方法

最近，一种名为DiverseEvol的新方法在GitHub上发布，它可以让AI模型选择自己的训练数据，使其在不需要人工或其他先进AI系统的帮助下变得更好。DiverseEvol方法包括两个步骤：第一步是从数据集中选择用于训练模型的样...

2024-01-22 talkingdev

近日，GitHub开源了一项名为FILCO的技术，旨在通过上下文过滤来提高人工智能系统的性能，特别是在回答问题和核查事实等领域。该技术的工作原理是选择最有用的信息，并训练模型来过滤掉不相关的细节。相比传统的人工...

2024-01-22 talkingdev

以往认为难问题需要难数据，但这些数据很难标记且带噪音。这项研究表明，对相关但易处理的数据进行微调训练，可以极大提高模型解决难问题的能力。这是支持微调训练是引出知识而非添加知识的又一数据点。本研究成果对...

2024-01-09 talkingdev

V*是一种新的基于图像的搜索算法，可以显著提高GPT-V（和其他VLM）验证码识别性能。这项技术的开发者表示，V*可以通过大量的图像数据来训练模型，从而提高模型的精度。V*算法的另一个优点是它可以将不同的图像元素组...

2023-12-11 talkingdev

最近，Mistral发布了一个使用MLX生成文本的示例，这是一种基于人工智能的技术，它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到，它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...

2023-11-22 talkingdev

Orca模型是微软的一组小型模型，擅长推理任务。由于许多信息被保密，因此存在关于其有效性的担忧。现在发布了Orca 2，该模型可在HuggingFace上获得。它展现了良好的性能，超过了几个较大模型的推理基准。

2023-11-15 talkingdev

在深度学习领域中，视觉语言模型（VLM）越来越受到重视。由于Embedding as a Service Vision-Language Pre-Trained Models（VLPM）中的预训练模型包含了大量的视觉和语言信息，因此这种模型很容易成为恶意攻击的目标...

2023-11-14 talkingdev

随着最近发布的优秀Zephyr语言模型，HuggingFace团队展示了如何在少数强大的预训练开源模型基础上训练个性化模型。HuggingFace对齐手册提供了一系列对齐技术的详细解释，并介绍了如何在不同任务上使用预训练模型。此...