GPT-3的相关内容 - 漫话开发者

2024-03-05 talkingdev

特斯拉CEO马斯克起诉OpenAI

特斯拉CEO马斯克起诉OpenAI，声称GPT-4构成AGI，不再受限于与微软的协议。他还主张更多的透明度和公开性。OpenAI是人工智能研究公司，由马斯克等人创立。该公司的GPT-3模型在自然语言处理领域取得了重要进展，但也引...

2024-02-22 talkingdev

近期，AI领域的重大进展，特别是谷歌的Gemini提供了超过一百万标记的上下文窗口，以及Groq的硬件使得GPT-3.5模型的响应几乎是即时的，这标志着AI应用迈入了实践时代，同时也凸显了领袖们理解和适应快速演变的AI应用...

2024-02-19 talkingdev

Meta使用大型语言模型为其代码库编写测试，发现测试覆盖率和整体代码质量都有了实质性的提高。这种方法可以有效地帮助开发人员减少手动编写测试的时间和成本，并且可以提高测试的效率和准确性。Meta表示，他们使用了...

2024-02-13 talkingdev

本研究着眼于一个基于大型语言模型的国际象棋AI是如何工作的。该AI使用了GPT-2和GPT-3模型，并通过对棋盘上的棋子和动作进行编码来训练自己。研究人员还探索了AI模型内部的世界，包括其理解和预测对手的能力，以及在...

2024-02-09 talkingdev

Abacus AI开发的一款名为“Smaug-72B”的新型开源语言模型，源自阿里巴巴集团的Qwen团队开发的“Qwen-72B”，现在领导Hugging Face的自然语言处理排行榜。在各种基准测试中，Smaug-72B胜过了已经成熟的模型，如GPT-3.5和...

2024-02-06 talkingdev

研究表明，经过调整的BERT模型在检测假新闻方面比通用的LLM模型（如GPT-3.5-turbo）更有效。BERT模型是一种预训练的自然语言处理模型，可用于各种文本任务。由于假新闻的传播日益严重，利用AI技术检测假新闻变得越来...

2024-01-10 talkingdev

Portkey AI最近开源了LLM Gateway，实现了多个不同语言模型之间的路由。这个开源项目旨在简化在不同的语言模型之间进行选择和路由的过程，从而更好地利用不同模型的优势，提高语言模型的整体性能。 LLM Gateway是一...

2024-01-10 talkingdev

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5（即使它可能是3倍大小）。有关模型训练，令牌计数，模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器，它使用自...