标记提示集是一种聪明的方法,可以显着提高视觉+语言模型的性能。Roboflow的这个库为您提供类似的控制,并使使用这些模型构建强大的视觉管道变得更加容易。它甚至支持像LLaVa这样的开放模型。
Read MoreLLM是一种全新的机器学习技术,可以让应用程序在运行时不断学习和优化,从而实现更高效的性能和更低的成本。Tanuki是一款基于LLM技术的应用程序构建工具,可以帮助开发人员轻松创建这种具有自我学习和优化能力的应用...
Read More科学家们开发出一种新方法,使用生成扩散技术创建代理数据集,这种数据集具有更好的代表性和更多样化,同时需要的计算资源更少。这种方法可以通过在代理数据集中训练神经网络来提高模型的性能。这种方法可以降低计算...
Read MoreDiffSLVA是一种创新的手语视频匿名化方法,可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块,克服了以前的限制,不需要精确的姿势估计。
Read MoreStableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...
Read More稳定AI发布了一款新模型SDXL Turbo,可以在207ms内生成高分辨率图像。该模型不使用LCM,而是采用一种称为对抗扩散蒸馏的新颖蒸馏技术。该模型的权重和代码已被用于研究中。
Read MoreMeta AI最近发布了名为CICERO的AI代理,这是首个在外交策略游戏中达到人类水平的AI代理。CICERO在Diplomacy游戏中表现出了惊人的策略水平,其表现与人类玩家相当,并且超过了其他AI代理。Meta AI表示,CICERO的成功...
Read More近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...
Read More