漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-28 talkingdev

Meta LLM Compiler:神经优化器和反汇编器

Meta LLM编译器是一种新型编译器,采用神经网络进行优化和反汇编,能够显著提高代码的性能和可读性。该编译器可以自动检测代码中的瓶颈,并通过神经网络进行优化,从而提高代码的运行速度。此外,Meta LLM编译器还可...

Read More
2024-06-26 talkingdev

Imbue公司以其训练出的70B模型匹敌GPT-4

Imbue公司成功训练并发布了一款极其强大的70B语言模型。这款模型采用了Imbue自家的优化器,以及一些出色的数据过滤技术,训练过程中没有出现任何损失峰值。这表明该公司在技术上取得了显著的突破,为人工智能语言模...

Read More
2024-05-13 talkingdev

Mirage张量优化器:引领线性代数模块性能的新高度

Mirage项目是一个多层次的张量优化引擎,能够产生极高性能的线性代数模块内核。它利用了张量的多层结构,进行深度优化,从而实现了高度优化的内核计算。在GitHub上,Mirage项目已经开源,并得到了广大开发者的热烈追...

Read More
2024-04-08 talkingdev

Meta开源新模型训练优化器代码,无需LR调度

Meta的研究团队近日推出了一款新型的优化器,并已在X平台上公开代码及其多种集成方式。这款优化器的独特之处在于它不依赖于学习率(LR)调度,训练过程中无需预先设定总步数。经过实证,该优化器在包括语言模型在内...

Read More
2024-03-18 talkingdev

pg_hint_plan:为PostgreSQL执行计划优化提供新策略

开源项目pg_hint_plan为开发者提供了一种新的方法,通过在SQL注释中使用提示来调整PostgreSQL的执行计划。在PostgreSQL中,规划器通过成本基优化器估算每个可能的执行计划的成本,并执行成本最低的计划。尽管Postgre...

Read More
2024-03-04 talkingdev

Daft:云端大数据处理的分布式查询引擎

Daft是一种专门为云端大数据处理而设计的分布式查询引擎。它具有熟悉的交互式API、强大的查询优化器、数据目录集成、丰富的多模式类型系统等特点。Daft的设计目的是能够处理任何数据,它专为大型机器集群上的交互式...

Read More
2023-10-05 talkingdev

Pytorch发布新的分布式Shampoo优化器(GitHub Repo)

人工智能系统由架构、数据和训练方法三部分组成,优化器则是训练方法中的重要组成部分。目前,Adam优化器因其“即插即用”的特性而深受大众喜爱。然而,LION和Shampoo这两种优化器逐渐获得了人们的认可。来自Meta的Pyt...

Read More
2023-06-21 talkingdev

LOMO:高效的LLM训练(GitHub开源)

这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...

Read More
2023-05-30 talkingdev

Sophia:一种用于语言模型预训练的可扩展的随机二阶优化器

近日,Sophia的官方实现已经上线,Sophia是一种可扩展的随机二阶优化器,用于语言模型预训练。以下是该实现的三个核心要点: - Sophia是一种适用于大规模语言模型预训练的随机二阶优化器; - Sophia的实现基于PyTor...

Read More