漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-30 talkingdev

基于Phi-2和SigLIP训练的多模态模型,可在本地设备上运行

最近,一款基于Phi-2和SigLIP训练的多模态模型Imp v1 3B发布了。该模型在性能上表现极为出色,并且体积小,足以在设备上运行。Imp v1 3B的发布,对于未来的多模态研究和应用具有重要意义。目前,该模型的开源代码已...

Read More
2023-12-20 talkingdev

Google Vision开源权重分片,提升多节点系统训练效率

Google的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近,他们添加了权重分片,使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型,分别在不同的节点上进行训练,最后再将...

Read More
2023-11-21 talkingdev

Neural-Cherche:神经搜索模型微调库开源

Neural-Cherche是一个库,旨在为特定数据集微调神经搜索模型,例如Splade,ColBERT和SparseEmbed。 在搜索模型中进行微调可以提高搜索结果的质量,从而更好地满足用户需求。 该库现已开源,可在GitHub上获取。此外,...

Read More
2023-10-20 talkingdev

XAgent:开源自主代理工具

XAgent是一个开源的实验性LLM驱动的自主代理工具,可以自动解决各种任务。该工具利用深度学习算法,训练出一个自主学习的模型,可以在不同的环境中自动适应并完成任务。XAgent提供了丰富的API接口,可以与其他工具无...

Read More
2023-08-28 talkingdev

WizardLM团队利用新技术突破开源代码模型性能瓶颈,超越Phind模型

近日,WizardLM团队利用他们的Evol instruct技术显著提升了Llama代码的性能,甚至击败了Phind模型。此次成果尽管受到一些质疑,因为他们生成的指令直接提升了评估分数,而未使用固定的数据集,也没有把评估视为固定...

Read More
2023-07-25 talkingdev

优化物体检测算法:AlignDet引领新技术潮流(GitHub开源代码库)

最近,有一款名为AlignDet的两阶段预训练框架在GitHub上开源,旨在弥补物体检测算法中的预训练和微调程序之间的差距。AlignDet的设计目标是提高算法的性能、泛化能力以及收敛速度。通过对预训练和微调过程的深度优化...

Read More
2023-07-08 talkingdev

InternLM公开7亿参数的基础聊天模型,专为实际场景设计

近日,InternLM在GitHub上公开了一款专为实际场景设计的基础聊天模型。该模型拥有7亿的参数,可广泛应用于各种实际场景,如客户服务、在线咨询等。InternLM的这款模型采用了先进的深度学习技术,能够理解和回应用户...

Read More
2023-06-15 talkingdev

开源代码模型击败ChatGPT在编码任务中(GitHub Repo)

近日,一种开源代码模型在编码任务中表现超越ChatGPT等语言模型。封闭模型之所以强大,是因为它们实际上是伪装成语言模型的代码模型。很多开放式语言模型表现不佳,因为它们无法从大规模的代码预训练中获得推理能力...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page