漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-18 talkingdev

如果AI正在使图灵测试过时,什么可能更好?

研究人员提出了一个新颖的框架,将人工智能程序视为心理研究中的参与者。该框架有三个步骤:在一系列实验中测试程序的推理能力,测试其对自身推理方式的理解,并且如有可能,检查程序源代码的认知适应性。虽然目前的...

Read More
2023-10-23 talkingdev

Hugging Face Hub发布Math Mistral模型,助力数学与推理能力的提升

近日,人工智能技术公司Hugging Face Hub发布了一款名为Math Mistral的模型,该模型针对数学及推理能力进行了训练,具备强大的能力和广泛的应用场景。 Math Mistral是一种基于自然语言处理技术的模型,它可以帮助用...

Read More
2023-10-13 talkingdev

GPT-4的推理能力已被充分证明

尽管GPT-4缺乏意识和长期记忆,但有充分的证据表明它能够推理和理解概念。GPT-4是人工智能领域中最先进的语言模型,它可以生成高质量的自然语言文本。尽管它缺少人类的智能,但它可以在多个领域表现出惊人的表现力。...

Read More
2023-10-11 talkingdev

论文:提升大型语言模型(LLMs)的数学推理能力

研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

Read More
2023-10-05 talkingdev

思考再说:为LLMs添加暂停标记以提高推理能力

最近的研究表明,为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明,将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理(仅解码器,最高可达10亿)的能力,最多可提高18%。直观上...

Read More
2023-09-28 talkingdev

Llava-RLHF视觉对齐模型的全新技术突破

Llava是一种将视觉能力插入语言模型的方法。现在,它已经通过指令调整,并运行了RLHF(强化学习和直觉推理)过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度,使得计算机不仅...

Read More
2023-09-19 talkingdev

为何开源AI将赢得未来

开源的人工智能(AI)模型相比之下,对于专有模型有着显著的优势。对于大多数AI应用而言,控制能力、定制性、透明度和信任度比高级推理能力更为重要。AI原生公司应该专注于拥有他们的核心模型,而不是将他们的智能层...

Read More
2023-09-12 talkingdev

大型语言模型能否具备推理能力

大型语言模型(LLMs)是否具备人类般的推理能力的争论仍在进行中。一方面,有些研究显示,这些模型主要依赖于记忆和模式匹配。另一方面,也有研究显示,它们在与训练数据相关的任务中表现出色,显示出一定的推理能力...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page