漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-01 talkingdev

Chatbot Arena榜单更新:Anthropic的Claude 3首次超越OpenAI的GPT-4

在由大型模型系统组织运营的排行榜Chatbot Arena上,Anthropic公司的聊天机器人Claude 3 Opus首次超越了OpenAI的GPT-4。Chatbot Arena是一个开放模型的排行榜,它允许访问者对不同模型的输出进行评分,从而计算出综...

Read More
2024-03-28 talkingdev

Claude 3首次超越GPT-4登顶Chatbot Arena排行榜

Anthropic旗下的Claude 3聊天机器人在Chatbot Arena的排行榜上首次超越了OpenAI的GPT-4。Chatbot Arena是由大型模型系统组织运营的一个排行榜,该组织专注于开放模型的研究。该网站允许访问者对不同模型的输出进行评...

Read More
2024-02-29 talkingdev

伯克利函数调用排行榜

函数调用是指语言模型可以通过合成的函数访问工具来完成其给定的指令。这需要正确合成参数以传递给这些函数。这个排行榜旨在评估模型在函数调用任务上的能力。

Read More
2024-02-09 talkingdev

Smaug-72B:开源AI模型的新王者

Abacus AI开发的一款名为“Smaug-72B”的新型开源语言模型,源自阿里巴巴集团的Qwen团队开发的“Qwen-72B”,现在领导Hugging Face的自然语言处理排行榜。在各种基准测试中,Smaug-72B胜过了已经成熟的模型,如GPT-3.5和...

Read More
2024-01-25 talkingdev

大模型LLM幻觉排行榜

最近,一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据,让人们更好地了解这些模型的优势和不足。据悉,该排行榜是由...

Read More
2023-06-13 talkingdev

基础模型能否像人类一样标记数据?

最近,关于语言模型的热潮导致了各种各样的声明,比如“我们的模型被 ChatGPT N% 的时间所偏好”。但这种声明通常隐藏了一个事实,那就是 ChatGPT 实际上是偏向 GPT4 模型的。这其中涉及到各种各样的问题,包括校准、...

Read More
2023-06-01 talkingdev

全球最佳的开放式语言模型现在免费使用

开放式语言模型Falcon是极其强大的,但以限制性的收益分享模型发布。现在这个限制已被取消,该模型可以自由使用。该模型在HuggingFace排行榜上排名第一。 ### 新闻要点: - Falcon模型是开放式语言模型中最好的之...

Read More