代码的相关内容 - 漫话开发者

2024-02-29 talkingdev

字节跳动开发 MegaScale 系统，可用于训练大型语言模型

据悉，字节跳动开发了一种名为 MegaScale 的系统，可用于训练大规模并行的大型语言模型。该系统成功地在 12,288 个 GPU 上训练了一个 175B 的语言模型，达到了 55.2% 的模型 FLOPs 利用率，相当惊人。此外，字节跳动...

2024-02-28 talkingdev

据悉，Litestar是一款轻量级、灵活的ASGI框架，适用于构建高性能API。其优点在于提供了简洁的API并支持异步编程模型，还具有可扩展性、易用性和可读性等优秀特性。此外，Litestar还为开发人员提供了丰富的文档和示例...

2024-02-28 talkingdev

近日，ingestr在GitHub推出了一款命令行工具，可用于在不编写任何代码的情况下，实现任意源数据库到任意目的数据库的数据复制。ingestr支持增量加载，包括追加、合并或删除+插入等多种方式。

2024-02-27 talkingdev

这是一份关于使用LLMs进行注释的精选论文列表，LLMs是一种基于机器学习的语言模型，能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率，目前在自然语言处理和计算机视觉领域被广泛...

2024-02-27 talkingdev

OpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder，通过训练合成多轮数据集和使用人类反馈，能够在编程HumanEval基准测试中获得85%以上的准确率。

2024-02-26 talkingdev

谷歌工程师和科学家开发了一个新的代码库，名为CPP Gemma推理引擎。与llama.cpp类似，该代码库允许在SIMD CPU架构上进行推理。该工具的目的是鼓励实验和使用昨天发布的Gemma模型。

2024-02-26 talkingdev

Phind的70B代码模型在人类评估中获得83%的高分，与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布，更大的70B模型也将在未来发布。

2024-02-26 talkingdev

Functional UI Kit是一个专注于可访问性、开发体验和设计师-开发者协作体验的设计系统。它使用Figma变量和CSS变量共享相同的名称、用法和继承结构。每个Figma变量都有一个直接对应的CSS变量，因此不会混淆。Function...