漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-12 talkingdev

论文:OV-DINO-开放词汇检测的新方法

OV-DINO是一种新的开放词汇检测方法,它应对了整合多元化数据源和利用语言感知能力的挑战。这种方法的出现,解决了以往在处理大规模、复杂的数据集时,因为缺乏有效的语言感知工具和方法,而无法充分挖掘和利用数据...

Read More
2024-06-27 talkingdev

医疗模型与GPT 4达到同等水平

这款7b模型在医疗数据上进行了训练,当由医生进行人类偏好评估时,其与GPT-4打成了平手。这表明了医疗领域AI技术的强大进步。这款模型的性能与GPT-4相当,显示出其在理解和解析医疗数据方面的强大能力。这项成就不仅...

Read More
2024-06-06 talkingdev

MatMul突破性成果:无需矩阵乘法的高性能大型语言模型

研究人员发现了一种方法,可以在无需进行矩阵乘法(MatMul)的情况下,依然保持大型语言模型的强大性能,甚至在参数规模达到数十亿时仍然有效。这一突破性技术有望显著提高计算效率,减少资源消耗,并为未来的AI模型...

Read More
2024-05-24 talkingdev

论文:GLSCL提升文本视频检索效率

研究人员开发了一种新的方法——全局-局部语义一致学习(Global-Local Semantic Consistent Learning,简称GLSCL),以提升文本视频检索的效率。这一创新方法不仅提高了检索的准确性,还显著降低了计算成本。GLSCL通过...

Read More
2024-05-24 talkingdev

苹果计划2026年推出可折叠MacBook,配备18.8至20英寸显示屏

苹果公司正在研发一款配备折叠显示屏的MacBook,预示着可折叠技术在笔记本电脑领域的新突破。此前有传言称,苹果可能选择一款20英寸的显示屏,但最新报道显示,公司同样在考虑18.8英寸的面板选项。当这款设备闭合时...

Read More
2024-05-23 talkingdev

MedLFQA:提升医疗AI准确性的全新数据集

MedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...

Read More
2024-05-15 talkingdev

论文:深度学习新模型,无状态序列并行推理

深度学习领域有了一项新的突破。研究人员开发出了一个新的状态空间模型,这一模型使用双重转移函数表示。其主要特点是一个无状态的序列并行推理算法。这种新的推理算法能够在处理大规模数据时,有效提高计算效率和准...

Read More
2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ,一种新型量化算法,通过使用4位权重、8位激活和4位KV缓存,加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术,它能够减少模型的存储需求和计算复杂性。在这种情况下,QoQ算法采用了较低精度的数...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page