生成模型的相关内容 - 漫话开发者

2024-02-26 talkingdev

Stability AI发布Stable Diffusion 3，模型参数达80亿

Stability AI宣布推出Stable Diffusion 3，这是一款类似于OpenAI的Sora的Diffusion Transformer。公司训练了一套模型，参数范围从8亿到80亿，这是从以前的图像生成模型中跨越式的飞跃。这些模型将在经过一段时间的研...

2024-02-21 talkingdev

Magic正在构建一款AI软件工程师，并获得更多资金来支持这一过程。该公司最近获得1.17亿美元的资金，以帮助开发人员自动生成代码。Magic的平台使用AI技术，可以自动完成大量编码工作，从而节省时间和减少人为错误。该...

2024-02-19 talkingdev

OpenAI发布了一款新的视频生成模型，具有惊人的质量。目前，红队测试人员可以使用它进行测试。

2024-02-16 talkingdev

近日，Facebook发布了一款最先进的开源音频模型MaGNET，该模型速度是其他替代品的7倍，而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布，更多详情请访问GitHub仓库。

2024-02-15 talkingdev

近日，针对LLMs设计的结构化生成语言SGLang在GitHub上发布。SGLang的设计目的是为了帮助LLMs更加轻松地构建结构化的文本生成模型，从而加速生成文本的过程。SGLang采用了类似于HTML的标记语言来描述文本结构，同时支...

2024-02-09 talkingdev

Google的MusicLM团队使用了300k份反馈和其他奖励信号，在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异，但尚不清楚哪种RL方法能产生最高保真度的输出。

2024-02-09 talkingdev

这些文本转语音模型由Stability AI开发，可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集，因此其创作者合成注释了大量的语音语料库进行训练。这是注释，上字幕和训练生成模型...

2024-02-06 talkingdev

近日，一种名为3D topia的生成模型在GitHub上发布。该模型采用两阶段的过程来生成候选项，然后再对这些选定的候选项进行精细化处理。这个模型可以将文本转化为3D模型，具有很强的生成能力。目前，该模型还处于开发中...