漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-30 talkingdev

用纯 Rust 运行 Mamba大模型推理

受 Llama 模型的努力启发,这个项目使用纯 Rust 在 CPU 上运行 Mamba 推理。

Read More
2024-01-30 talkingdev

从零开始构建语言模型的LLM

LLMs from Scratch是学习如何从零开始构建语言模型的一组不完整但有前途的任务。该仓库提供了构建自然语言处理模型所需的基本知识,包括基础数学和机器学习理论,以及一些常见的语言模型架构和实现代码。通过完成这...

Read More
2024-01-30 talkingdev

基于Phi-2和SigLIP训练的多模态模型,可在本地设备上运行

最近,一款基于Phi-2和SigLIP训练的多模态模型Imp v1 3B发布了。该模型在性能上表现极为出色,并且体积小,足以在设备上运行。Imp v1 3B的发布,对于未来的多模态研究和应用具有重要意义。目前,该模型的开源代码已...

Read More
2024-01-30 talkingdev

GitHub Copilot调研发现'代码质量下降'

最近一项关于 AI 辅助代码质量和可维护性的研究发现了令人不安的趋势。预计今年撰写的代码中,在两周内被撤销或更新的行数的百分比将比 AI 之前的基准线翻倍。使用 AI 编码工具与错误代码被推送到存储库之间存在强烈...

Read More
2024-01-29 talkingdev

改进语义分割:SFC让模型更准确

研究人员开发出一种名为共享特征校准(SFC)的方法,以增强语义分割。这个方法通过在特征图上进行跨层归一化,来缩小不同层次特征图之间的差异,从而提高了模型的性能。通过在多个数据集上的测试,研究人员发现,使...

Read More
2024-01-29 talkingdev

LLM Steer - 控制生成的语言模型库开源

LLM Steer是一个用于使用情感向量控制语言模型生成的库。这意味着您可以嵌入一个诸如“深思熟虑”的概念,并使生成变得更加深思熟虑。一般而言,它的效果要比提示更好,但需要进行更多的研究。

Read More
2024-01-29 talkingdev

探究.git文件夹

本文介绍了.git文件夹内部的内容。对于每个目录和文件,都进行了解释和示例。文章开头提供了一张图像,其中包含了.git文件夹各个部分的约15个单词的解释。.git文件夹是Git版本控制系统的核心,了解其中的文件和目录...

Read More
2024-01-26 talkingdev

Local-SGD:谷歌开源高效LLM训练方法

研究人员探索了一种名为异步Local-SGD的新的语言模型训练方法。这种方法是联邦平均的一种变体。

Read More
  1. Prev Page
  2. 42
  3. 43
  4. 44
  5. Next Page