漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
2024-03-06 talkingdev

Anthropic发布Claude 3家族的三个新模型,最强模型匹敌GPT4

Anthropic最近发布了Claude 3家族的三个新模型,其中最强的模型匹敌了GPT4的报告基准结果。此外,这是一个多模态模型,对视觉任务表现良好。值得注意的是,Claude的编码能力在此版本中得到了显著提高。

Read More
2023-06-23 talkingdev

MPT 30B发布:具备编码能力的巨型语言模型

MPT是MosaicML推出的一系列语言模型。仅在推出几周内,其7B模型已经被下载了数百万次。这款全新的30B模型是在H100s上进行训练的,具备8000个上下文长度。它经过商业授权,甚至可以进行编码!该模型可以在单个A100上...

Read More
2023-05-23 talkingdev

英特尔发布Aurora GenAI,挑战ChatGPT

英特尔宣布推出Aurora GenAI,这是其与ChatGPT等AI模型竞争的产品,拥有高达1万亿个参数。该模型旨在应对复杂任务,承诺提升对话、翻译、摘要和编码能力。这是英特尔宏伟的AI战略的一部分,得到了学术和研究机构的合...

Read More
2023-05-01 talkingdev

AI代码机器人比较:评估Bing、Claude、Co-Pilot、GPT-4和Bard的编码能力

以下是这篇四分钟阅读文章中的三个核心观点: - Hacker Noon评估了多个AI编码机器人,包括Bing、Claude、Co-Pilot、GPT-4和Bard,以评估它们的编码能力。 - 这篇文章揭示了这些先进工具在软件开发中的潜力和局限性...

Read More