最近在《自然》杂志上介绍了一种名为FunSearch的方法,它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对,以产生可验证的解决方案,并在难以解决的cap set 和bin-packing问题...
Read MoreGitHub上发布了一个名为“Flexible Vision Transformer”的仓库,该架构设计用于创建任意分辨率和纵横比的图像。与传统模型不同,FiT将图像视为变量大小的标记序列,在训练和推理过程中更有效地适应不同的图像大小。这...
Read MoreSasha Rush发布了一份注释教程,介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误,它目前无法扩展,但它是技术的极端演示,并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...
Read More据报道,软银集团创始人孙正义正在推出Izanagi,一个旨在与Nvidia竞争并专注于人工智能应用的1000亿美元芯片创业公司。Izanagi的目标是利用孙正义在AI和5G技术领域的经验来打造出一种全新的芯片,以满足未来的需求。...
Read MoreHuggingFace Hub最近发布了全新的视频模型Sora,现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究,为研究人员和开发者提供了很好的参考。此外,这些论文还包括了Sora model在计算机视觉...
Read More据报道,OpenAI已经开发了两种类型的AI Agent软件超过一年。第一种类型可以通过接管客户设备来自动化复杂的任务。第二种AI代理类处理基于Web的任务并可以收集公共数据。目前尚不清楚公司计划何时发布这些代理。
Read MoreMuse是一个旨在发明一个新的计算环境,更好地服务于科学家、作家、企业家、设计师和建筑师等重要知识工作者的项目。在Muse的探索中,研究人员们试图为知识工作者提供一个更加灵活、更加智能的工作环境,以便他们能够...
Read More