漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-15 talkingdev

使用视觉语言模型实现自主驾驶

本报告评估了GPT-4V在自主驾驶中的应用,重点关注其在场景理解、决策制定和实时响应方面的能力。GPT-4V是一种基于视觉语言模型的人工智能技术,能够自动识别和理解图像中的物体、道路、标志和其他要素,并作出相应的...

Read More
2023-11-14 talkingdev

基于RWKV可在本地运行的AI小镇开源

AI 小镇是一个令人惊叹的实验,在这里,数百个代理在语言模型的提示状态下过着日常生活。 RWKV 模型是一种线性语言模型,需要比标准 Transformer 更少的资源。此存储库使用这个更便宜的模型在您的本地计算机上运行 A...

Read More
2023-11-14 talkingdev

HuggingFace发布对齐手册:Zephyr语言模型实现个性化训练

随着最近发布的优秀Zephyr语言模型,HuggingFace团队展示了如何在少数强大的预训练开源模型基础上训练个性化模型。HuggingFace对齐手册提供了一系列对齐技术的详细解释,并介绍了如何在不同任务上使用预训练模型。此...

Read More
2023-11-10 talkingdev

Roboflow发布GPTV示例,辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。

Read More
2023-11-09 talkingdev

Langroid多智能体Agent编程框架开源

受 Actor 框架的启发,这个轻量级的 Python 库使得创建基于 LLM 动力的代理变得非常容易。Langroid 多智能体编程框架(Langroid multi-agent programming framework)最近发布了他们的 GitHub Repo,使得该项目的开...

Read More
2023-11-09 talkingdev

OVIR-3D,可实现即时3D搜索技术开源

OVIR-3D是一项创新技术,可以通过2D图像融合实现从文本提示中检索3D对象,无需3D数据训练,从而实现即时实时搜索功能,非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库,使更多开发者可以在其应用中...

Read More
2023-11-08 talkingdev

ChatGPT更新预警创业者:大型科技公司随时可能摧毁创业公司

我们已经在不愿意投资只是包装GPT的公司方面看到了这一点,现在更加清晰了。随着能够查询上传的PDF的能力,一大批初创公司被抹去了。

Read More
2023-11-08 talkingdev

30T多语言开放数据集发布

Red Pajama v2已发布。它比用于训练GPT-4的数据集大2.5倍。它包含5种语言的多语言数据,并具有令人印象深刻的广度。重要的是,已经完成了许多去重工作和一些启发式过滤工作,没有代码数据。

Read More
  1. Prev Page
  2. 54
  3. 55
  4. 56
  5. Next Page