漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-06 talkingdev

ViCo:使用扩散模型的轻量级文本到图像生成技术

近日,一项名为ViCo的新技术问世,其可以根据文本描述生成逼真的图像,并且能够从仅有的几个样本中捕捉到新概念的细节。与其他方法不同,ViCo对系统资源的消耗较小,不需要对原始模型的参数进行微调,但它仍然通过专...

Read More
2023-06-06 talkingdev

无需提示的扩散,文本转图像更进一步 (GitHub仓库)

最近,研究人员在文本转图像(T2I)领域中推出了一种新的方法,称之为“无需提示的扩散”。这种系统只依靠视觉输入生成图像,无需任何文本提示。其利用了一种称为“语义上下文编码器(SeeCoder)”的独特结构来解释参考...

Read More
2023-06-06 talkingdev

GitHub开源项目“思维之树”:全新算法提高模型推理能力70%

近日,一款名为“思维之树”(Tree of Thoughts,简称ToT)的全新算法在GitHub上开源。这款算法不仅具备强大的灵活性,还将模型推理能力提高了70%。 以下是本次报道的核心内容: - “思维之树”是一款全新的算法。 -...

Read More
2023-06-05 talkingdev

开源项目:AWQ技术让大型AI模型更小更快

最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...

Read More
2023-06-02 talkingdev

智能GPT程序现已上线GitHub

--- 智能GPT程序是一款能够帮助LLMs使用插件完成复杂任务的程序,现已在GitHub上线。 ### 核心要点 - 智能GPT程序上线GitHub。 - 该程序可为LLMs提供插件来完成复杂任务。 - 这个程序可以提高LLMs的工作效率。

Read More
2023-06-02 talkingdev

GitHub推出GPT4Tools:控制视觉基础模型

近日,GitHub推出了GPT4Tools系统,该系统能够通过分析语言内容,管理多个视觉基础模型,使其能够根据用户在对话中的需求自动决定、控制和使用不同的模型。与众不同的是,它还可以通过简单的自我指导和LoRA方法,让...

Read More
2023-06-02 talkingdev

GitHub开源自动驾驶技术:多相机联合预训练

内容摘要: - 研究介绍了一种名为“Occ-BEV”的自动驾驶预训练方法,旨在充分利用多个相机视角,而不仅仅是一个,从而捕捉周围环境的更准确理解。 - 该技术使用独特的3D解码器来预测环境的三维几何形状。 - 这一技术的...

Read More
2023-06-01 talkingdev

本地GPT:使用Vicuna-7B模型和InstructorEmbeddings实现离线问答

近日,开发者们在GitHub上发布了一个名为localGPT的Repo,该项目利用Vicuna-7B模型和InstructorEmbeddings实现了离线文档问答功能。以下是该项目的主要亮点: - 使用Vicuna-7B模型:该模型是由EleutherAI开发的巨型...

Read More
  1. Prev Page
  2. 87
  3. 88
  4. 89
  5. Next Page