漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-01 talkingdev

Nvidia推出CUDA-checkpoint工具包:助力分布式训练大型AI模型

Nvidia最近发布了一个新的工具包,可以对CUDA状态进行检查点设置,以便于传输和重启。这一工具包在GitHub上公开,对于大型AI模型的分布式训练非常有用。CUDA状态的检查点设置可以在训练过程中保存模型的状态,以便在...

Read More
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-03-20 talkingdev

全新数据压缩技术:AI模型训练数据集大幅缩减

近日,一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报',使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

Read More
2024-02-28 talkingdev

旧金山计算公司推出全球最便宜的H100训练集群

旧金山计算公司(SF Compute)现在推出了全球最便宜的H100训练集群,并提供灵活的短期租赁选项,针对需要进行AI模型训练的客户,而无需长期承诺。其第一个集群Angel Island已经上线,另一个Bay Bridge即将推出。SF C...

Read More
2023-12-15 talkingdev

OpenAI与Axel Springer签署许可协议,用新闻内容训练AI模型

OpenAI与柏林出版商Axel Springer达成协议,将使用该出版商的内容来训练其生成式AI模型,并将最近由Axel Springer发布的文章添加到ChatGPT中。这项协议将使OpenAI的AI模型能够更好地理解新闻内容和语言,从而提高其...

Read More
2023-10-25 talkingdev

艺术家的武器!数据污染工具让艺术家对抗生成式AI

芝加哥大学的研究人员开发了一种工具,让艺术家可以给他们的艺术作品添加不可见的变化,这会导致AI模型训练失败。这个工具旨在防止AI公司未经许可使用艺术家的作品。这个叫Nightshade的工具将被集成到Glaze中,Glaze...

Read More
2023-08-11 talkingdev

多家媒体要求制定AI训练数据新规

近日,多家媒体组织联名发布公开信,呼吁全球立法者考虑制定保护版权的规定,针对用于训练生成性AI模型的数据。他们要求在使用数据进行训练之前,必须对训练数据集进行透明化,并获取权利所有者的同意。公开信还要求...

Read More
2023-04-19 talkingdev

AI制作的德雷克和The Weeknd歌曲被下架

匿名音乐家使用AI制作的,模仿德雷克和The Weeknd声音的说唱歌曲《心系衣袖》因版权问题被下架。环球音乐集团(UMG)要求流媒体平台禁止使用版权音乐进行AI训练,这首歌曲可能会侵犯艺术家的公开权。但使用版权歌曲...

Read More