视觉处理的相关内容 - 漫话开发者

2024-06-03 talkingdev

Mora：挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型，它利用多个视觉AI代理，旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统，这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

2024-05-23 talkingdev

近日，MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色，甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言，还在光学字符识别（OCR）和视觉问答（visual quest...

2024-05-21 talkingdev

最近，一种名为LeMeViT的新方法用于降低视觉变换器中的计算成本，其核心策略是使用可学习的元令牌。这些令牌能够有效地捕获关键信息，从而提高推理速度。视觉变换器在计算机视觉领域有着广泛的应用，然而其计算成本...

2024-02-12 talkingdev

新加坡Brilliant Labs推出了一款名为Frame的轻量级AR眼镜，配备了一款名为Noa的多模态AI助手，可以通过集成的AI模型如GPT-4和稳定扩散执行视觉处理、图像生成等多项任务，获得了多位创业投资人的青睐。据悉，这款眼...