训练模型的相关内容 - 漫话开发者

2023-11-08 talkingdev

利用LLM提高推荐系统精度的新方法

近日，研究人员提出了一种名为CLLM4Rec的全新方法，该方法通过高级预训练和新型语言嵌入，将大型语言模型与基于ID的系统相结合，提高了推荐精度。研究人员表示，CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...

2023-11-03 talkingdev

这项研究表明，使用大型语言模型将类别组织成层次结构可以提高图像分类的准确性，从而解决预训练模型（如CLIP）中存在的偏差问题，这些模型会混淆相似的类别。

2023-10-31 talkingdev

Magnetic是一个用于轻松集成大型语言模型到Python代码的库。这个名为Magnetic的库是由NLP引擎提供商Hugging Face发布的。基于Transformers，Magnetic允许您轻松地将大型语言模型集成到您的Python代码中，以进行各种...

2023-10-03 talkingdev

语言模型的性能往往受到其上下文长度的限制。一般来说，上下文长度的限制主要源于计算硬件和聪明的算法更新。StreamingLLM（Github Repo）提供了一种算法更新，通过将令牌流式传输至注意力机制，理论上可以支持无限...

2023-09-22 talkingdev

这项研究介绍了AV-SUPERB，这是一个新的基准测试，用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展，并为未来的研究提供一个统一的平台。这项研究突出了模...

2023-09-06 talkingdev

近日，人工智能科技公司Hugging Face发布了一项新的服务，该服务使得用户无需处理复杂的内部过程，仅需一键，即可对模型进行训练。这项创新型服务意味着，用户可以省去在深度学习项目中进行模型训练时，所需投入的大...

2023-08-10 talkingdev

本文将详细介绍如何使用Llama论文来训练TinyShakespeare。Llama是一个新型的人工智能训练模型，具有高效和精准的特性。TinyShakespeare是一个文本生成模型，其设计目标是模仿莎士比亚的写作风格生成文本。本指南将带...

2023-08-07 talkingdev

本文是对LLMs领域近几年发展的总结，旨在帮助行外人士了解LLMs是什么、可以用于什么、如何训练它们以及在使用它们时所面临的挑战，包括安全性、效果和伦理等方面。文章包含了演讲中的带有注释的幻灯片以及额外的笔记...