漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-26 talkingdev

如何让大型语言模型运行更快

本文提供了一份长而广泛的调查,介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的,但可以用作学习有趣主题的跳板。在可能的情况下,它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...

Read More
2023-12-05 talkingdev

万能GPT来袭,美国政府与英特尔启动ScienceGPT训练计划

近日,美国政府与英特尔公司合作启动了一个名为ScienceGPT的训练计划。该计划旨在训练一个万亿参数的GPT模型,以便提高自然语言处理的效率和精度。GPT(Generative Pre-trained Transformer)是一种基于Transformer...

Read More
2023-11-26 talkingdev

17世纪的ChatGPT是什么样子?MonadGPT揭秘

近日,美国加州伯克利分校的研究人员开发出了一款名为MonadGPT的人工智能模型,该模型基于GPT-3,旨在探究一个问题:如果ChatGPT在17世纪得以发明,会是怎样一番景象。MonadGPT通过对17世纪的语言和文化进行研究,成...

Read More
2023-11-23 talkingdev

亚马逊据称正在使用两倍于GPT-4的参数进行AI训练

亚马逊正在为进入AI竞赛做准备,推出Olympus,这是一个拥有2万亿参数的大型语言模型,旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表,但它...

Read More
2023-11-08 talkingdev

OpenAI Dev Day回顾

在本周的OpenAI Dev Day上,OpenAI发布了一款名为GPT-4 Turbo的API,它可以提供128k上下文的自然语言处理,以及自定义GPT和视觉功能。这款API的成本只有GPT-3的一小部分。此外,OpenAI还发布了一款名为Codex的API,...

Read More
2023-11-06 talkingdev

Talk Llama开源:在终端上与LLaMA AI对话

最近,一个名为Talk Llama的Github仓库备受关注,该仓库提供了一种在终端上与LLaMA AI进行交互的方式。LLaMA AI是一个基于GPT-3的自然语言处理模型,它的名字是“Language Model for Multi-turn Dialogue with Latent...

Read More
2023-11-01 talkingdev

Phind称其模型打败GPT-4,速度等同于GPT-3.5,支持16k上下文编码

据最新消息,Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码,在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器,可以用于编写各种程序代码。该模型采用...

Read More
2023-10-31 talkingdev

AMD发布第二轮训练,为大型语言模型训练提供更强的支持

MosaicML发布了一篇关于使用AMD GPU进行大型语言模型训练的文章。该公司在本文中介绍了他们的最新研究结果,使用AMD Radeon Instinct MI100 GPU对GPT-2、GPT-3和T5等大型语言模型进行了训练。结果显示,使用AMD GPU...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page