Go的相关内容 - 漫话开发者

2023-06-29 talkingdev

DeepMind开源FlamingoV2模型，可回答视觉问题

Flamingo是DeepMind的一个模型，可以处理图像和文本。它能够回答视觉问题，并具有强大的语言建模性能。这项工作是对这些模型的复制研究。它还使用了MPT和Red pajama基础模型，这些模型在许可使用上较为灵活。这个复...

2023-06-27 talkingdev

DeepMind的Gemini大型语言模型是使用AlphaGo的技术进行训练的，AlphaGo是第一个在围棋比赛中击败职业人类选手的AI系统。Gemini可以规划、解决问题和分析文本。它将AlphaGo类型系统的优势与大型语言模型的能力相结合...

2023-06-27 talkingdev

Giskard是一个专注于机器学习模型测试的开源框架，适用于从表格模型到LLM（Language Learning Models）的各种模型。该框架提供了一套强大的工具和方法，帮助开发人员测试和验证机器学习模型的准确性和鲁棒性。Giskar...

2023-06-27 talkingdev

Kor是一种新的技术，它利用LLMs（Language Learning Models）从文本中提取结构化数据。LLMs是一种能够理解和处理自然语言的模型，它们可以对文本进行深度分析，找出其中的关键信息和结构。Kor通过使用LLMs，可以将文...

2023-06-21 talkingdev

Autolabel是一个Python库，可以使用你选择的任何大型语言模型（LLM）来标注、清理和丰富文本数据集。

2023-06-21 talkingdev

这项研究介绍了LOw-Memory Optimization（LOMO），这是一种旨在显著减少大型语言模型（LLM）训练所需资源的优化器，目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU（每个具有24...

2023-06-19 talkingdev

Meta计划提供免费的商业AI模型，这是一个战略性举措，可能会对其竞争对手Google和OpenAI施加压力。Meta希望通过使AI更易于开发者使用来使其商品化，这可能会使Google和OpenAI难以保持竞争优势。

2023-06-14 talkingdev

研究人员提出了竞争性基准测试系统"AlgoPerf"，旨在公平评估各种深度学习算法的训练效果，并为未来的改进奠定基础。这一研究解决了比较和改进深度学习训练算法的挑战，这些算法是加速数据处理、节省资源和创建准确模...