漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-07 talkingdev

Together AI发布高分辨率图像处理新模型DragonFly Vision

Together AI团队发布了一款名为DragonFly Vision的全新视觉语言模型(VLM)。该模型因其高效的架构在处理极高分辨率图像方面表现卓越。DragonFly Vision采用了一系列先进的技术,包括深度学习和神经网络优化,从而实...

Read More
2024-05-28 talkingdev

苹果AI战略揭秘:Project Greymatter将革新关键应用

苹果的AI战略致力于通过实用的AI功能来提升其产品。核心项目之一是Project Greymatter,这是一套将集成到苹果关键应用中的AI工具。这些AI工具旨在提供更智能、更高效的用户体验,涵盖从语音助手到图像识别等多方面的...

Read More
2024-05-15 talkingdev

Google推出全新轻量级模型Gemini Flash,拥有多模态推理和高达百万Token上下文窗口

近日,Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术,使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...

Read More
2024-05-14 talkingdev

MoonDream COYO Captions:基于COYO数据集的500万条图像标注描述

MoonDream最新发布COYO Captions,这是一个包含500万条全新图像描述的数据库,这些描述基于COYO数据集部分图像及其替代文本。COYO数据集是一个大型的、多元化的图像数据集,它包含了各种不同的场景和对象。通过这500...

Read More
2024-05-06 talkingdev

谷歌发布包含1.5万张极致详细全标注的图像数据集

谷歌近日发布了一份新的数据集,包含了1.5万张极其详细和全面标注的图像。这个数据集的特点在于其精确度和全面性,每张图像都进行了详尽的标注,提供了丰富且精确的数据资源,为研究人员提供了强大的工具,可以用于...

Read More
2024-05-06 talkingdev

Spider模型:革新性模型助力理解上下文相关概念

Spider是一个新型的统一模型,旨在增强对上下文依赖(CD)概念的理解,如伪装物体和医疗病变等。这些概念在很大程度上依赖于视觉背景。这个模型的独特性在于,它能够理解并应对由视觉环境变化引起的复杂情况。蜘蛛模...

Read More
2024-05-02 talkingdev

论文:CLIP预训练的Mamba模型,零样本图像分类的新标杆

近日,一个全新的Mamba模型引起了工业界的广泛关注。该模型通过使用对比性语言-图像预训练(CLIP)的方式进行训练,展现出在零样本图像分类任务上的出色效率和性能。据了解,零样本分类任务一直是计算机视觉领域的一个...

Read More
2024-05-01 talkingdev

论文:探索Mamba,先进计算机视觉的视觉基础模型

Mamba模型是一种先进的方法,擅长处理长序列,而不会带来传统Transformers的计算缺点。在计算机视觉领域,Mamba模型已经取得了显著的成果,并在多个应用中展现出其优越性。相比于传统的Transformers模型,Mamba模型...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page