漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-23 talkingdev

结合无监督训练和监督微调的效果存在挑战

近日,一项新的研究挑战了结合监督微调和强化学习的训练方法的有效性。研究表明,在初始训练中使用更先进的模型(如GPT-4)可以优于更复杂的两步方法。这一研究的开源代码已经发布到GitHub上,供科研人员使用和参考...

Read More
2024-02-19 talkingdev

RoCo-开源高效LLM新策略

GitHub近日开源了一项名为RoCo的新策略,该策略旨在提高LLM在有限资源环境下的效率。RoCo是一种强大的缓存遗漏策略,可以帮助用户更好地使用LLM。该政策的发布将有助于优化机器学习应用的性能,提高效率。RoCo的开源...

Read More
2024-02-14 talkingdev

深度强化学习的无人机控制策略训练库开源

最近,一家科技公司发布了一个训练端到端控制策略的代码库,用于使用深度强化学习训练无人机控制策略。该训练在模拟环境中进行,可以在消费级笔记本电脑上在几秒钟内完成。训练出的策略具有通用性,可以部署在真实的...

Read More
2024-02-12 talkingdev

MetaTree:基于Transformer的决策树算法

近日,一种名为MetaTree的新型决策树算法在GitHub上公开发布。与传统的决策树算法不同,MetaTree采用Transformer模型进行学习,从而提高了泛化能力。根据开发者的介绍,MetaTree在多个数据集上进行了测试,结果表明...

Read More
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2024-01-30 talkingdev

基于Phi-2和SigLIP训练的多模态模型,可在本地设备上运行

最近,一款基于Phi-2和SigLIP训练的多模态模型Imp v1 3B发布了。该模型在性能上表现极为出色,并且体积小,足以在设备上运行。Imp v1 3B的发布,对于未来的多模态研究和应用具有重要意义。目前,该模型的开源代码已...

Read More
2023-12-21 talkingdev

TokenAny-可对任何事物进行标记

近日,GitHub仓库上线了一款全新的模型,可同时进行图像分割、识别和标注,超越了之前的能力。这个新模型的优势在于可以标记任何事物,不再局限于传统的图像和文本。目前,该模型已经在多个领域得到了广泛的应用,包...

Read More
2023-12-21 talkingdev

STSSNet,增强型实时渲染项目

该项目介绍了时空超采样(STSS),这是一个显著改进实时渲染高分辨率、高帧率内容的框架。该项目已在GitHub上发布,用户可以从中获取源代码并进行使用。

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page