漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-23 talkingdev

开源多模态对话模型ChatterBox

众所周知,现代对话模型依赖于纯文本输入,因此在语言和视觉交互中,模型的表现力有限。为了克服这些限制,研究人员一直在探索多模态对话系统。在此背景下,ChatterBox是一种优秀的多模态对话模型,可在新建立的多模...

Read More
2024-02-23 talkingdev

Lorax-多LoRA模型推理服务器开源

Lorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时,RAM内存占用会大幅减少。

Read More
2024-02-23 talkingdev

结合无监督训练和监督微调的效果存在挑战

近日,一项新的研究挑战了结合监督微调和强化学习的训练方法的有效性。研究表明,在初始训练中使用更先进的模型(如GPT-4)可以优于更复杂的两步方法。这一研究的开源代码已经发布到GitHub上,供科研人员使用和参考...

Read More
2024-02-23 talkingdev

ChartX:测试多模态语言模型理解视觉数据的可视化工具

近日,一种名为ChartX的新工具发布在GitHub上,用于测试多模态大语言模型(MLLM)在解释和推理可视化图表方面的能力。ChartX通过评估模型对图表的理解能力来测试其多模态能力,包括语言和视觉。该工具可以评估多种不...

Read More
2024-02-23 talkingdev

Pages CMS开源:静态网站开发者的福音

Pages CMS是一款为静态网站打造的开源内容管理系统。它允许开发者通过用户友好的界面直接在GitHub上编辑网站内容。Pages CMS旨在与Cloudflare Pages一起部署,使用Cloudflare Workers进行无服务器代码编写。

Read More
2024-02-22 talkingdev

BoCoEL开源:利用贝叶斯优化准确评估LLMs

近日,开源项目BoCoEL在GitHub上发布。BoCoEL是一个用于准确评估LLMs的工具,采用贝叶斯优化方法,能够从大量的LLMs中找到最佳的架构和超参数组合。BoCoEL可以帮助研究者更快地训练出高效的LLMs,提高模型的准确性和...

Read More
2024-02-22 talkingdev

GausO-用4张照片生成高质量3D物体

该仓库提供了一种方法,可以利用四张照片生成高质量的3D物体,采用的是高斯平面填充技术。该技术可以将照片中的物体转化为点云,再通过高斯平面填充算法生成3D物体。这种方法不需要大量的照片和设备,可以在普通相机...

Read More
2024-02-22 talkingdev

VLM开源:增强AI对抗攻击的防御能力

近日,GitHub推出了一项新的方法,可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器,有效地保护这些模型免受恶意图像攻击,提高了它们在现实应用中的可靠...

Read More
  1. Prev Page
  2. 35
  3. 36
  4. 37
  5. Next Page