AR的相关内容 - 漫话开发者

2024-01-09 talkingdev

微软的观察员被报道加入OpenAI董事会

据报道，微软副总裁Dee Templeton已加入OpenAI董事会，担任非投票观察员。OpenAI是一家人工智能研究实验室，由伊隆·马斯克、萨姆·阿尔特曼等人创立。Templeton此前曾担任微软的高级研究员和首席财务官，并曾领导微软...

2024-01-09 talkingdev

V*是一种新的基于图像的搜索算法，可以显著提高GPT-V（和其他VLM）验证码识别性能。这项技术的开发者表示，V*可以通过大量的图像数据来训练模型，从而提高模型的精度。V*算法的另一个优点是它可以将不同的图像元素组...

2024-01-09 talkingdev

Transformer是自然语言处理中非常重要的模型，但对于初学者来说可能有些困难。然而，这篇文章提供了一个非常好的介绍，对于具有基本数学和Python技能的人来说非常易于理解。作者详细解释了Transformer的工作原理，并...

2024-01-09 talkingdev

本文深入探讨了如何打造一种具有人类思维过程的人工智能。在过去的几十年中，人工智能一直是计算机科学领域的一个热门话题。尽管现在已经有了许多成功的应用程序，但我们远远没有达到完全模拟人类思维过程的目标。本...

2024-01-09 talkingdev

《2023人工智能专家调查报告》显示，科学界对人工智能发展的速度和影响存在严重分歧。一些重要的里程碑比预期提前实现。超过一半的受访者对人工智能对人类的影响持乐观态度，但仍有关于其潜在滥用的担忧，强调有必要...

2024-01-09 talkingdev

LLaVA-Phi是一款创新的多模态助手，它使用Phi-2语言模型。尽管参数只有2.7B，但LLaVA-Phi在多模态对话中表现出色，结合了文本和视觉。该助手可以在多个领域内使用，例如智能家居和自动驾驶等。

2024-01-09 talkingdev

这项项目介绍了一种方法，可以适应各种任务的类似CLIP的视觉语言模型，同时保留其泛化能力。该方法从LLM数据中学习提示，避免了需要标记图像的需求。

2024-01-09 talkingdev

DiffusionEdge是一种新颖的边缘检测模型，它集成了扩散概率模型，可以在资源有效的同时提供更准确和清晰的边缘图。传统的边缘检测模型对于噪声和边缘不清晰的情况表现得不够稳定。DiffusionEdge的扩散模型可以帮助减...