纽约大学(NYU)最近推出了一种全面公开、性能卓越的视觉模型Cambrian-1。此模型对文本编码器和数据混合进行了大规模的消融研究。这一技术的开发,将对视觉模型的研发产生深远影响,推动相关技术向前发展。全面开放...
Read MoreSuri是一个由20,000份长篇文本和复杂指令配对的数据集。这个数据集的设计目的是为了提高AI的写作约束执行能力。开发Suri的团队引入了指令性ORPO(I-ORPO),这是一种利用合成破坏指令进行反馈的对齐方法。通过这个方...
Read MoreTime最近与OpenAI签订了一项许可协议,允许OpenAI的人工智能在其101年的新闻资料库上进行训练,并获取实时内容以回答用户关于突发新闻的查询。作为回报,OpenAI将引用Time,并链接回其源材料。这项协议的签订,标志...
Read MoreMUMU视觉模型是一种创新的生成图像模型,它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于,它不仅仅是将...
Read MoreLambda Labs最近在其1-click集群上训练了一个名为Open Sora的视频模型,用于制作乐高电影。这一技术的出现,不仅改变了乐高动画制作的传统方式,也为AI技术在创新应用中开辟了新的道路。利用这一模型,制作者可以方...
Read MoreLosslessCut是一款免费、开源的视频/音频编辑工具,可以快速剪辑、裁剪、分离、合并视频/音频文件,而且完全不会影响文件的原始质量。它非常适用于需要快速剪辑视频/音频的人,比如YouTuber、播客、视频爱好者等等。...
Read More本文主要介绍了如何快速实现Mamba 2,而不需要关联扫描。Mamba 2是一种新型的技术实现,其主要优势在于无需进行繁琐的关联扫描,大大提高了工作效率。这种实现方式不仅节省了大量时间,而且降低了出错的可能性。在Gi...
Read More我们很高兴地宣布,Gemma 2系列的两款新型号——9B和27B现已正式上市。这两款新型号均秉承了Gemma 2系列的一贯优良传统,将先进的技术与优雅的设计完美融合。无论是在性能、可靠性还是易用性方面,Gemma 2的9B和27B都...
Read More