GPT的相关内容 - 漫话开发者

2024-02-27 talkingdev

Mistral AI发布新模型，与GPT-4和自己的聊天助手竞争

Mistral AI推出了一款名为Mistral Large的新型语言大模型，以与GPT-4和Claude 2等顶级模型竞争。该公司还推出了一项名为Le Chat的新服务，以与ChatGPT竞争。通过该公司的API，访问Mistral Large的成本为每百万输入令...

2024-02-26 talkingdev

MMedLM 2是一种开创性的多语言语言模型，专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中，MMedLM 2的表现优于其他模型，包括GPT-4。

2024-02-26 talkingdev

Phind的70B代码模型在人类评估中获得83%的高分，与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布，更大的70B模型也将在未来发布。

2024-02-23 talkingdev

GTBench是一个用于测试类似GPT-4这样的LLMs在各种游戏场景中发现其在策略推理方面的优势和劣势的平台。虽然这些模型在基于概率的游戏中表现出很大的潜力，但在确定性游戏中表现不佳，并且在设计和训练上表现也有所不...

2024-02-23 talkingdev

Predibase发布了25个狭窄的任务特定LoRA，每个在特定任务上都能超越GPT-4。这些任务特定的LoRA是建立在Mistral 7B模型之上的。这再次证明了本地模型在精确任务上表现异常出色的能力。

2024-02-23 talkingdev

近日，一项新的研究挑战了结合监督微调和强化学习的训练方法的有效性。研究表明，在初始训练中使用更先进的模型（如GPT-4）可以优于更复杂的两步方法。这一研究的开源代码已经发布到GitHub上，供科研人员使用和参考...

2024-02-22 talkingdev

近期，AI领域的重大进展，特别是谷歌的Gemini提供了超过一百万标记的上下文窗口，以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的，这标志着AI应用迈入了实践时代，同时也凸显了领袖们理解和适应快速演变的AI应用...

2024-02-22 talkingdev

知名研究员Nicholas Carlini发布了他用于评估大型语言模型性能的基准。有趣的是，它让GPT-4的表现在大多数其他基准之上。据了解，这个基准是基于多个指标和任务，包括自然语言推理和问答等。