技术的相关内容 - 漫话开发者

2024-07-01 talkingdev

纽约大学全面开源高性能视觉模型Cambrian-1

纽约大学（NYU）最近推出了一种全面公开、性能卓越的视觉模型Cambrian-1。此模型对文本编码器和数据混合进行了大规模的消融研究。这一技术的开发，将对视觉模型的研发产生深远影响，推动相关技术向前发展。全面开放...

2024-07-01 talkingdev

Suri是一个由20,000份长篇文本和复杂指令配对的数据集。这个数据集的设计目的是为了提高AI的写作约束执行能力。开发Suri的团队引入了指令性ORPO（I-ORPO），这是一种利用合成破坏指令进行反馈的对齐方法。通过这个方...

2024-07-01 talkingdev

Time最近与OpenAI签订了一项许可协议，允许OpenAI的人工智能在其101年的新闻资料库上进行训练，并获取实时内容以回答用户关于突发新闻的查询。作为回报，OpenAI将引用Time，并链接回其源材料。这项协议的签订，标志...

2024-07-01 talkingdev

MUMU视觉模型是一种创新的生成图像模型，它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于，它不仅仅是将...

2024-07-01 talkingdev

Lambda Labs最近在其1-click集群上训练了一个名为Open Sora的视频模型，用于制作乐高电影。这一技术的出现，不仅改变了乐高动画制作的传统方式，也为AI技术在创新应用中开辟了新的道路。利用这一模型，制作者可以方...

2024-06-30 talkingdev

LosslessCut是一款免费、开源的视频/音频编辑工具，可以快速剪辑、裁剪、分离、合并视频/音频文件，而且完全不会影响文件的原始质量。它非常适用于需要快速剪辑视频/音频的人，比如YouTuber、播客、视频爱好者等等。...

2024-06-28 talkingdev

本文主要介绍了如何快速实现Mamba 2，而不需要关联扫描。Mamba 2是一种新型的技术实现，其主要优势在于无需进行繁琐的关联扫描，大大提高了工作效率。这种实现方式不仅节省了大量时间，而且降低了出错的可能性。在Gi...

2024-06-28 talkingdev

我们很高兴地宣布，Gemma 2系列的两款新型号——9B和27B现已正式上市。这两款新型号均秉承了Gemma 2系列的一贯优良传统，将先进的技术与优雅的设计完美融合。无论是在性能、可靠性还是易用性方面，Gemma 2的9B和27B都...