漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-25 talkingdev

ParaLLM :Mac上基于MLX实现每秒1300个Token推理

MLX中实施批量并行KV缓存,导致合成数据生成和模型完成的推理时间显著提速。这种新的技术实现方式大大加快了处理速度,从而在Mac上每秒可以处理1300个Token。这一突破性的技术进步,不仅可以提高处理效率,同时也...

Read More
2024-04-03 talkingdev

Light Whisper:为苹果芯片打造极速Whisper语音识别实现

Lightning Whisper MLX是一款针对苹果硅芯片优化的Whisper语音识别算法的高速实现版本。它采用批量解码技术以提高吞吐量,运用蒸馏模型以加快解码速度,并引入量化模型以加速内存传输。相较于传统的Whisper CPP,Lig...

Read More
2024-02-13 talkingdev

RLX: 基于MLX的强化学习框架

RLX是一个基于MLX的强化学习框架,旨在为研究人员和工程师提供一个易于使用的平台,以便开发和实现强化学习算法。 RLX提供了一组易于使用的API和工具,可以帮助用户轻松地构建和训练强化学习模型。此外,RLX还提供了...

Read More
2023-12-11 talkingdev

MistralMLX文本生成示例

最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...

Read More
2023-12-11 talkingdev

Llama 2模型成功在MLX上运行

仅仅在苹果公司推出MLX框架的一天后,人们已经成功将Llama 2模型运行在了新框架上。据悉,这是由于MLX框架的开放性,使得用户可以更加方便地进行模型的迁移和使用。同时,这也展示了MLX框架在机器学习领域的强大性能...

Read More