漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-25 talkingdev

人类反馈改善语言模型:DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而,使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明,可以直接针对人类偏好进行优化,从而绕过奖励模型。借助基于文本的强化学习,你可...

Read More
2023-08-25 talkingdev

Meta发布自己的AI代码编写工具:Code Llama

Meta发布了Code Llama,这是一个建立在Llama 2之上的大型语言模型,专门用于生成和调试代码。它还发布了一个针对Python的特定版本,以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

Read More
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-21 talkingdev

Meta将推出下一个开源AI项目,据说是一个代码生成机器人

据报道,Meta的下一个AI发布将是一台编码机器。它可能会在下周发布。Code Llama将是开源的,并且免费提供。它将基于Llama,并在开发人员输入代码时自动为他们提供代码建议。

Read More
2023-08-16 talkingdev

AI与内存壁垒:LLaMA.cpp的崛起之路

LLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook能够以稍慢于A100的速度运行最先进的模型呢?答案在于,当你一次只处理一个批次,一个标记的时候,内存带宽就成了瓶颈。而M2的内存带宽与A100的之间的差距...

Read More
2023-08-14 talkingdev

Orca与Platypus LLM的强大结合

众多模型都基于Llama 2进行构建,并在GPT-4的输出上进行训练。在非商业许可的模型中,Orca和Platypus LLM的结合表现出了强大的能力。这些模型可以说是处于这个范围,但它们已经非常强大。基于Llama 2的模型数量众多...

Read More
2023-08-14 talkingdev

ChainML发布开源AI Agent平台Council

近期,ChainML发布了Council——一款开源的AI代理平台,它使得快速开发和部署定制的生成AI应用变得简单。Council可以与多种语言理解模型(LLMs)如GPT-4、Llama 2和Claude 2等进行集成,以实现业务应用的生成AI,从而...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page