漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

论文:深度学习新模型,无状态序列并行推理

深度学习领域有了一项新的突破。研究人员开发出了一个新的状态空间模型,这一模型使用双重转移函数表示。其主要特点是一个无状态的序列并行推理算法。这种新的推理算法能够在处理大规模数据时,有效提高计算效率和准...

Read More
2024-05-13 talkingdev

Mirage张量优化器:引领线性代数模块性能的新高度

Mirage项目是一个多层次的张量优化引擎,能够产生极高性能的线性代数模块内核。它利用了张量的多层结构,进行深度优化,从而实现了高度优化的内核计算。在GitHub上,Mirage项目已经开源,并得到了广大开发者的热烈追...

Read More
2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ,一种新型量化算法,通过使用4位权重、8位激活和4位KV缓存,加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术,它能够减少模型的存储需求和计算复杂性。在这种情况下,QoQ算法采用了较低精度的数...

Read More
2024-05-09 talkingdev

Google DeepMind与Isomorphic Labs发布AlphaFold 3,预测蛋白质折叠能力提升50%

Google DeepMind与Isomorphic Labs联手开发了第三代AlphaFold,这是一款强大的蛋白质折叠预测模型。他们正在推出AlphaFold Server,这是一种免费的与模型交互的方式。AlphaFold 3比前两代的准确性提高了50%。它准确...

Read More
2024-04-28 talkingdev

使用Unsloth微调Llama3:显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...

Read More
2024-03-27 talkingdev

DETR技术开源,提升目标检测性能

近期,一个名为Salience DETR的项目引起了业界关注。该项目采用了层次化显著性过滤技术,对目标检测中的查询选择进行了优化。通过这种方式,Salience DETR在保持计算效率的同时,也提高了检测的准确性。这一技术的出...

Read More
2024-03-22 talkingdev

论文:扩散状态空间模型引领图像生成新纪元

扩散状态空间模型(DiS)是一种新型的扩散模型,它采用状态空间骨干代替了传统的U-Net处理图像数据。这种模型在保持计算效率的同时,能够处理长距离依赖问题,并且能够生成高质量的图像。与传统的U-Net相比,DiS模型...

Read More
2024-03-21 talkingdev

矩阵乘法新突破,清华与伯克利联手推动理想计算

清华大学与加州大学伯克利分校的研究团队在矩阵乘法领域取得了重大突破,提出了一种创新技术,该技术已经激发了进一步的优化。这一在核心计算操作上的进步,可能在各种应用中带来显著的时间、能源和成本节省。自2010...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page