推理能力的相关内容 - 漫话开发者

2023-12-18 talkingdev

如果AI正在使图灵测试过时，什么可能更好？

研究人员提出了一个新颖的框架，将人工智能程序视为心理研究中的参与者。该框架有三个步骤：在一系列实验中测试程序的推理能力，测试其对自身推理方式的理解，并且如有可能，检查程序源代码的认知适应性。虽然目前的...

2023-10-23 talkingdev

近日，人工智能技术公司Hugging Face Hub发布了一款名为Math Mistral的模型，该模型针对数学及推理能力进行了训练，具备强大的能力和广泛的应用场景。 Math Mistral是一种基于自然语言处理技术的模型，它可以帮助用...

2023-10-13 talkingdev

尽管GPT-4缺乏意识和长期记忆，但有充分的证据表明它能够推理和理解概念。GPT-4是人工智能领域中最先进的语言模型，它可以生成高质量的自然语言文本。尽管它缺少人类的智能，但它可以在多个领域表现出惊人的表现力。...

2023-10-11 talkingdev

研究人员正在探究数据增强技术对提高大型语言模型（LLMs）数学推理能力的影响。他们通过增强现有数据集中的查询，创建了一个新的数据集AugGSM8K，并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...

2023-10-05 talkingdev

最近的研究表明，为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明，将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理（仅解码器，最高可达10亿）的能力，最多可提高18%。直观上...

2023-09-28 talkingdev

Llava是一种将视觉能力插入语言模型的方法。现在，它已经通过指令调整，并运行了RLHF（强化学习和直觉推理）过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度，使得计算机不仅...

2023-09-19 talkingdev

开源的人工智能（AI）模型相比之下，对于专有模型有着显著的优势。对于大多数AI应用而言，控制能力、定制性、透明度和信任度比高级推理能力更为重要。AI原生公司应该专注于拥有他们的核心模型，而不是将他们的智能层...

2023-09-12 talkingdev

大型语言模型（LLMs）是否具备人类般的推理能力的争论仍在进行中。一方面，有些研究显示，这些模型主要依赖于记忆和模式匹配。另一方面，也有研究显示，它们在与训练数据相关的任务中表现出色，显示出一定的推理能力...