漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-16 talkingdev

Datomic与内容寻址技术的深度探讨

Datomic是一种基于时间的数据库,采用内容寻址技术,能够有效管理复杂数据结构。它通过将数据视为不可变的事实,允许开发者在时间维度上进行灵活查询。内容寻址技术则通过唯一标识符来引用数据,使得数据的存取更加...

Read More
2024-07-15 talkingdev

OpenDiLoCo:DeepMind系统实现跨数据中心训练并保持GPU使用

来自DeepMind的分布式低通信(DiLoCo)系统已被Prime Intellect复制。该系统能够实现跨数据中心的训练,同时保持GPU的使用。OpenDiLoCo的核心是其具有高度的可扩展性,可以处理大量的数据处理和分析任务,而不会对硬...

Read More
2024-02-21 talkingdev

OpenRLHF开源,提供基于Ray的RLHF实现

近日,GitHub上有一个新的仓库OpenRLHF发布了。这是一个基于Ray的RLHF实现,专为Llama样式模型设计。该仓库集成了多种PPO稳定技巧,以提高性能。Ray是一款新型的分布式计算框架,它具有高效、易用等特点,支持快速构...

Read More
2023-11-13 talkingdev

谷歌完成5万多芯片的最大分布式LLM训练任务

谷歌利用MaxText和Jax训练技术,同时在超过5万个芯片上进行了LLM(语言模型)训练任务,保持了66%以上的利用率,成为了最佳MFU的强有力竞争者。该项目主要基于专有技术,但其中展示了一些有趣的细节,对于其他大规模...

Read More
2023-08-08 talkingdev

计算机科学家Edsger Dijkstra每周工作一天的启示

Edsger Dijkstra在他的职业生涯中提出了分布式和并发计算中的一些重要思想。多年来,Dijkstra逐渐减少了对大学的参与,每周只去校园一天。他似乎与繁忙相反,但他却产出了大量的工作。这一观察提示,忙碌实际上可能...

Read More