开源代码的相关内容 - 漫话开发者

2024-01-30 talkingdev

基于Phi-2和SigLIP训练的多模态模型，可在本地设备上运行

最近，一款基于Phi-2和SigLIP训练的多模态模型Imp v1 3B发布了。该模型在性能上表现极为出色，并且体积小，足以在设备上运行。Imp v1 3B的发布，对于未来的多模态研究和应用具有重要意义。目前，该模型的开源代码已...

2023-12-20 talkingdev

Google的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近，他们添加了权重分片，使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型，分别在不同的节点上进行训练，最后再将...

2023-11-21 talkingdev

Neural-Cherche是一个库，旨在为特定数据集微调神经搜索模型，例如Splade，ColBERT和SparseEmbed。在搜索模型中进行微调可以提高搜索结果的质量，从而更好地满足用户需求。该库现已开源，可在GitHub上获取。此外，...

2023-10-20 talkingdev

XAgent是一个开源的实验性LLM驱动的自主代理工具，可以自动解决各种任务。该工具利用深度学习算法，训练出一个自主学习的模型，可以在不同的环境中自动适应并完成任务。XAgent提供了丰富的API接口，可以与其他工具无...

2023-08-28 talkingdev

近日，WizardLM团队利用他们的Evol instruct技术显著提升了Llama代码的性能，甚至击败了Phind模型。此次成果尽管受到一些质疑，因为他们生成的指令直接提升了评估分数，而未使用固定的数据集，也没有把评估视为固定...

2023-07-25 talkingdev

最近，有一款名为AlignDet的两阶段预训练框架在GitHub上开源，旨在弥补物体检测算法中的预训练和微调程序之间的差距。AlignDet的设计目标是提高算法的性能、泛化能力以及收敛速度。通过对预训练和微调过程的深度优化...

2023-07-08 talkingdev

近日，InternLM在GitHub上公开了一款专为实际场景设计的基础聊天模型。该模型拥有7亿的参数，可广泛应用于各种实际场景，如客户服务、在线咨询等。InternLM的这款模型采用了先进的深度学习技术，能够理解和回应用户...

2023-06-15 talkingdev

近日，一种开源代码模型在编码任务中表现超越ChatGPT等语言模型。封闭模型之所以强大，是因为它们实际上是伪装成语言模型的代码模型。很多开放式语言模型表现不佳，因为它们无法从大规模的代码预训练中获得推理能力...