Llama的相关内容 - 漫话开发者

2023-09-13 talkingdev

打造自己的Llama 2，取代GPT-3.5/4

人工智能领域的新闻总是让人振奋人心，最近有关Llama 2的消息开始引起了人们的关注。Llama 2是由OpenAI推出，这是一款新的人工智能模型，用于自然语言处理。Llama 2被称为是GPT-3.5/4的替代品，因为它可以在大多数任...

2023-09-12 talkingdev

语言模型推理通常较慢，因为这些模型的运行严重依赖内存。为了解决这一问题，人们引入了使用较小的草稿模型进行推测性解码，以“提前”提供给大模型的建议。这种方法效果不错，但实现起来复杂，且寻找一个好的草稿模型...

2023-09-05 talkingdev

小型羊驼（Tiny Llama）项目旨在为3T代币训练出一个参数为11亿的羊驼2（Llama2）模型。根据扩展规律，这对于计算优化来说无疑是严重的过度训练，但它对于部署优化带来了显著的收益。此次的模型训练打破了传统的优化...

2023-08-31 talkingdev

在当今的技术环境中，找到一个不基于Meta基础模型构建的模型是一项挑战。来自Writer的Palmyra模型经过了8000亿令牌和7万条精心策划的指令的训练。它擅长遵循复杂的指令，并且似乎易于进行微调。这种模型的出现，打破...

2023-08-31 talkingdev

近日，一篇深度解析如何使用PyTorch 2.0的torch.compile和Nvidia CUDA图表功能提升深度学习模型性能的文章引起了广泛关注。该文章详细介绍了借助CUDA图表在Llama 2上实现了2.3倍的速度提升。这对于对性能敏感的AI从...

2023-08-30 talkingdev

最近研究发现，Llama-2-70b在事实性方面的表现几乎与GPT-4相当，并且远超过gpt-3.5-turbo，更为重要的是，它的成本明显低于这两者。这一发现揭示了Llama-2-70b在文本总结和信息提取方面的强大实力，表明其在未来的AI...

2023-08-28 talkingdev

近日，WizardLM团队利用他们的Evol instruct技术显著提升了Llama代码的性能，甚至击败了Phind模型。此次成果尽管受到一些质疑，因为他们生成的指令直接提升了评估分数，而未使用固定的数据集，也没有把评估视为固定...

2023-08-28 talkingdev

拥有海量高质量内部数据的公司已发布了精调版Llama，它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意，当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...