漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

初创企业工程领导者最重要的技能

领导者和他们的团队最终决定成功的单一技能是节奏感——领导者必须与他们自己和团队的能力和耐力保持同步。

Read More
2024-03-12 talkingdev

黑客团队成功攻破Google AI系统获得50000美元奖金

Google最近开展了LLM bugSWAT活动,邀请黑客们在其人工智能系统中寻找安全漏洞。参赛选手Joseph “REZ0” Thacker、Justin “RHYNORATER” Gardner和Roni “LUPIN” Carta在Google的AI功能中发现了漏洞,包括利用GraphQL端...

Read More
2024-03-07 talkingdev

Vision-RWKV:处理高分辨率图像任务的高效模型

Vision-RWKV将NLP中的RWKV架构应用于视觉任务,为高分辨率图像处理提供了一个高效的解决方案。RWKV是一种基于注意力机制的架构,它在处理序列数据时表现出色,而Vision-RWKV则将其成功地应用于图像领域。该模型的表...

Read More
2024-03-07 talkingdev

初创公司在荒野训练LLM模型

Reka的创始人、著名GPU评论家Yi Tay在一篇博客文章中概述了他们在谷歌之外训练极强语言模型的经验。主要的挑战来自于集群和硬件的不稳定性,他们还发现软件的成熟度也是一个挑战。尽管如此,他们还是成功地训练出了...

Read More
2024-03-07 talkingdev

OpenAI回应Elon Musk的诉讼:公开邮件交流记录

OpenAI回应了Elon Musk的诉讼,并公开了Sam Altman、Ilya Sutskever、Greg Brockman和Elon Musk之间的邮件交流截图。这些截图显示,Musk认为OpenAI的成功率为0%,并同意有必要对某些模型进行闭源处理。

Read More
2024-03-06 talkingdev

Claude 3 Opus视频摘要技术开源

最近,知名机器学习专家Andrej Karpathy提出了一个具有挑战性的任务:从他最近的一段视频中提取摘要并发布博客文章。经过一些数据预处理,Claude 3成功地完成了这项任务,并发布了一篇高质量有趣的博客文章。Claude...

Read More
2024-03-05 talkingdev

论文:为什么学习率可以转移?

一篇理论论文试图解释MuP超参数转移的成功。其作者发现训练损失Hessian矩阵的最大特征值与网络的宽度和深度无关。

Read More
2024-03-05 talkingdev

GPT-4只能成功完成14%的Agent任务

社区对代理在处理各种数字工作负载方面的潜力非常兴奋。然而,即使是最好的通用模型也难以完成人类70%以上成功的任务。显然,我们可能需要专门针对这些任务进行训练的模型。

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page