漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-06 talkingdev

优秀演员还是一般演员:利用LLM检测假新闻

研究表明,经过调整的BERT模型在检测假新闻方面比通用的LLM模型(如GPT-3.5-turbo)更有效。BERT模型是一种预训练的自然语言处理模型,可用于各种文本任务。由于假新闻的传播日益严重,利用AI技术检测假新闻变得越来...

Read More
2023-10-31 talkingdev

微软研究小组开放GPT-3.5-turbo,参数达到20B

微软研究小组在一篇论文中提到,GPT-3.5-turbo(ChatGPT背后的模型)是一个具有20B参数的模型,该小组研究扩散模型用于代码。据称原始模型的参数为175B,因此可能进行了重新训练或蒸馏。

Read More
2023-10-23 talkingdev

HuggingFace Hub推出开源模型以提取结构化数据

企业中使用AI模型的主要用途之一是从非结构化文本中提取结构化数据,如JSON或CSV。目前主要使用gpt-3.5-turbo的函数调用来完成此任务。GoLLIE通常表现更好,可以更加自信地运行敏感数据。

Read More
2023-08-30 talkingdev

Llama 2准确度超越GPT-3.5-turbo,接近GPT-4,性价比更高

最近研究发现,Llama-2-70b在事实性方面的表现几乎与GPT-4相当,并且远超过gpt-3.5-turbo,更为重要的是,它的成本明显低于这两者。这一发现揭示了Llama-2-70b在文本总结和信息提取方面的强大实力,表明其在未来的AI...

Read More
2023-08-25 talkingdev

一键从命令行进行微调:新工具助力gpt-3.5-turbo调优

近日,一款新的工具引发了业界的广泛关注。这款工具可以自动化gpt-3.5-turbo的调优过程,用户只需一键操作,即可使用本地磁盘上的文件进行调优。这一技术的出现无疑为大数据处理和人工智能的发展带来了新的可能性。...

Read More
2023-08-23 talkingdev

聊天机器人GPT-3.5-turbo现可进行微调操作

您现在可以在自定义数据上微调gpt-3.5-turbo模型了。微调后的模型完全属于您,且不会利用您的数据训练其他模型。这种方法可以大大降低成本、提升控制性,并改善整体性能。此外,GPT-4的微调功能也将在今年秋季推出。

Read More
2023-08-17 talkingdev

使用GPT模型优化GitHub仓库的提交信息

在软件开发中,提交信息起着至关重要的作用,但很多提交信息都缺乏详细的描述。最近有一篇论文提出了一个新的方法,利用过去的提交历史,而非简单地生成提交信息。这篇论文提出了一个新的数据集,名为CommitChronicl...

Read More
2023-08-11 talkingdev

斯坦福AI Agents代码开源!

斯坦福大学的一个研究小组几个月前凭借他们完全模拟的村庄和逼真的居民生活引起了轰动。现在,这段代码已经开源。最有趣的部分可能是他们如何精心设计每个人和整个系统,以便与非状态保留的API(如gpt-3.5-turbo)合...

Read More
  1. Next Page