人工智能研究的相关内容 - 漫话开发者

2024-10-16 talkingdev

霍夫施塔特谈Lisp编程语言的深远影响

在1983年的重要论述中，霍夫施塔特探讨了Lisp编程语言的独特特性和其在人工智能领域的应用。他指出，Lisp不仅仅是一种编程语言，更是一种思维方式，它鼓励程序员以递归和符号处理的方式来解决复杂问题。霍夫施塔特强...

2024-07-19 talkingdev

研究人员提出了针对大型语言模型（LLMs）的补丁级别训练，以提高训练效率。补丁级别训练是一种新的技术，目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别，提高了模型的训练效率，...

2024-07-10 talkingdev

本项目深度探索了通向人工通用智能（AGI）的旅程，该旅程旨在以人类般的效率执行各种真实世界的任务。人工通用智能，是指能够理解、学习、适应和应对任何人类智能可以处理的任务的人工智能。这是一个极具挑战性的目...

2024-06-27 talkingdev

在预训练中，如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本，仍然能匹配各种任务的最新技术。在这个过程中，他们采用了一种名为“联合样...

2024-06-24 talkingdev

ReaLHF是一种全新的系统，它通过在训练过程中动态地重新分配参数和优化并行化，以提高来自人类反馈的强化学习（RLHF）的效率。ReaLHF通过创新的技术手段，实现了动态参数分配和并行化优化，从而达到了提高训练效率的...

2024-06-12 talkingdev

Mistral.rs是一款基于Rust的推理框架，其最新版本已经上线。这款框架在最新的版本中实现了性能的重大提升，增加了GGUF支持，并带来了更多其他改进。Mistral.rs是专为机器学习和人工智能研究者设计的一款强大工具，其...

2024-05-23 talkingdev

斯坦福大学人类中心人工智能研究院（Stanford HAI）发布了最新版本的基础模型透明度指数，对包括OpenAI和Google在内的14家主要人工智能开发商的透明度进行了评估。这些公司披露了之前未向公众公开的新信息，标志着在...

2024-05-20 talkingdev

xAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型，拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点，这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...

2024-05-10 talkingdev

Buzz是一个创新型的数据集，它在预训练中融合了偏好数据。该数据集的研究者们还发布了几个利用这些数据训练的模型。他们发现，这些模型在许多人类偏好任务上表现出色。Buzz数据集的出现，无疑为人工智能研究提供了新...

2024-05-01 talkingdev

在当今的人工智能研究领域，对模型的评估分数进行可视化是至关重要的。然而，许多图表在传达预期信息方面表现得并不好。这个GitHub项目展示了一些优秀的图表，并附带了在可视化结果时应该做什么和不应该做什么的建议...