漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-26 talkingdev

FunSearch: 利用LLM在数学科学中进行新发现

最近在《自然》杂志上介绍了一种名为FunSearch的方法,它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对,以产生可验证的解决方案,并在难以解决的cap set 和bin-packing问题...

Read More
2024-02-22 talkingdev

Flexible Vision Transformer开源,可生成任意分辨率图片

GitHub上发布了一个名为“Flexible Vision Transformer”的仓库,该架构设计用于创建任意分辨率和纵横比的图像。与传统模型不同,FiT将图像视为变量大小的标记序列,在训练和推理过程中更有效地适应不同的图像大小。这...

Read More
2024-02-22 talkingdev

深入探究:硬核Mamba技术加速

Sasha Rush发布了一份注释教程,介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误,它目前无法扩展,但它是技术的极端演示,并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...

Read More
2024-02-22 talkingdev

软银创始人孙正义计划为新芯片创业公司筹集1000亿美元

据报道,软银集团创始人孙正义正在推出Izanagi,一个旨在与Nvidia竞争并专注于人工智能应用的1000亿美元芯片创业公司。Izanagi的目标是利用孙正义在AI和5G技术领域的经验来打造出一种全新的芯片,以满足未来的需求。...

Read More
2024-02-21 talkingdev

KV Quant - 缩放至1000万个令牌

KV缓存的量化是Transformer架构的一个技术细节,它使其在推理时使用更少的内存。量化是在最小损失质量的情况下缩小浮点精度。

Read More
2024-02-20 talkingdev

Sora相关参考论文合集整理

HuggingFace Hub最近发布了全新的视频模型Sora,现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究,为研究人员和开发者提供了很好的参考。此外,这些论文还包括了Sora model在计算机视觉...

Read More
2024-02-20 talkingdev

OpenAI的下一个AI产品可能再次夺走你的工作

据报道,OpenAI已经开发了两种类型的AI Agent软件超过一年。第一种类型可以通过接管客户设备来自动化复杂的任务。第二种AI代理类处理基于Web的任务并可以收集公共数据。目前尚不清楚公司计划何时发布这些代理。

Read More
2024-02-19 talkingdev

Muse回顾:致力于为知识工作者打造新的计算环境

Muse是一个旨在发明一个新的计算环境,更好地服务于科学家、作家、企业家、设计师和建筑师等重要知识工作者的项目。在Muse的探索中,研究人员们试图为知识工作者提供一个更加灵活、更加智能的工作环境,以便他们能够...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page