AR的相关内容 - 漫话开发者

2023-11-30 talkingdev

Roboflow开源适用于多模态模型的提示库

标记提示集是一种聪明的方法，可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制，并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。

2023-11-30 talkingdev

LLM是一种全新的机器学习技术，可以让应用程序在运行时不断学习和优化，从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具，可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...

2023-11-30 talkingdev

科学家们开发出一种新方法，使用生成扩散技术创建代理数据集，这种数据集具有更好的代表性和更多样化，同时需要的计算资源更少。这种方法可以通过在代理数据集中训练神经网络来提高模型的性能。这种方法可以降低计算...

2023-11-30 talkingdev

DiffSLVA是一种创新的手语视频匿名化方法，可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块，克服了以前的限制，不需要精确的姿势估计。

2023-11-30 talkingdev

StableVSR是一种新颖的视频超分辨率（VSR）方法，利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比，StableVSR可以更好地处理不同的噪声和失真情况，并且在不需要额外训练数据的情况下也...

2023-11-30 talkingdev

稳定AI发布了一款新模型SDXL Turbo，可以在207ms内生成高分辨率图像。该模型不使用LCM，而是采用一种称为对抗扩散蒸馏的新颖蒸馏技术。该模型的权重和代码已被用于研究中。

2023-11-30 talkingdev

Meta AI最近发布了名为CICERO的AI代理，这是首个在外交策略游戏中达到人类水平的AI代理。CICERO在Diplomacy游戏中表现出了惊人的策略水平，其表现与人类玩家相当，并且超过了其他AI代理。Meta AI表示，CICERO的成功...

2023-11-30 talkingdev

近日，llamafile发布了新的GitHub Repo，它是一种新的单文件分发工具，允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行，而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...