计算机的相关内容 - 漫话开发者

2023-07-19 talkingdev

改善视频深度稳定性的新型工具（GitHub Repo）

最近，一篇新的研究论文介绍了一种名为“神经视频深度稳定器”的新方法，可以在视频中提供一致且准确的深度估计。同时，研究团队还发布了有史以来最大的自然场景视频深度数据集，名为“野生视频深度”。通过这种新的方法...

2023-07-12 talkingdev

AI模型包含许多参数，它们在计算机中以十进制数字的形式表示。这些数字的精度决定了它们的准确度和占用的空间大小。如果将精度从32位降低到16位，将会大幅提高运行速度。现在，我们可以将精度降低到4位，从而在一些...

2023-07-08 talkingdev

DragonDiffusion是一种全新的方法，旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应，DragonDiffusion可以进行各种详细的图像修改，如移动和调整对象的大小，替换外观，以及拖动内容，同时保持图像...

2023-07-05 talkingdev

Scenic是一个以注意力为核心的计算机视觉研究代码库。

2023-06-30 talkingdev

a16z详细阐述了计算机的未来以及从工具到伙伴的范式转变。该文章介绍了人工智能的未来可能发展方向。

2023-06-30 talkingdev

Inflection是一家成立仅一年的初创公司，由DeepMind前联合创始人和应用AI负责人创立，该公司获得了大量资金。该公司提供一款名为Pi的个性化AI助手。此次宣布的融资消息是在Inflection最近构建的Nvidia + CoreWeave超...

2023-06-26 talkingdev

学习离散化表示是计算机视觉领域的一个令人兴奋的研究领域。像CLIP这样的大规模对比方法一度让离散化研究失去了市场。然而，现在，借助开源扩散模型，我们可以利用文本标记的力量来解开图像中的对象，实现对AI生成图...

2023-06-26 talkingdev

TIMM中有许多顶级计算机视觉模型，但在处理生产系统时，通常需要更多。OpenMMlab提供了一套高质量的系统，用于各种视觉任务，如姿态和分割。