漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-03 talkingdev

开源实现扩展LLM大模型到128K上下文长度

一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...

Read More
2024-05-03 talkingdev

InstructDr新模型开源:开创视觉文档理解纪元

近日,GitHub Repo发布了一款名为InstructDr的模型,该模型的设计目标是在各种视觉文档理解任务中表现优异,如问题回答和信息提取等。InstructDr能结合文档图片和大型语言模型,适应新的任务和数据集,其性能超过了...

Read More
2024-05-03 talkingdev

SUNDAE:有效提升3D渲染质量的新方法

此项目介绍了一种名为SUNDAE的新技术,该技术通过频谱剪枝和神经补偿来提高内存效率。频谱剪枝是一种新颖的技术,通过消除无关紧要的高频信号,以降低存储和计算的需求。神经补偿则是通过学习数据的结构,来预测和补...

Read More
2024-05-03 talkingdev

使用对抗调优技术进行图像分割:Meta AI推出ASAM模型

Meta AI最新推出的Segment Anything Model(简称SAM)是计算机视觉领域的一个重要的基础模型,该模型在图像分割方面表现出色,但在某些特定领域中却显得力不从心。为了解决这个问题,Meta AI推出了一项新的项目,即A...

Read More
2024-05-03 talkingdev

论文:自监督学习推动脉冲神经网络的进步

Spikformer V2将自我关注机制与脉冲神经网络(SNNs)的生物效率相结合。这款创新型模型使用了脉冲自我关注机制和卷积茎,增强了其处理视觉特征的能力,同时具有能源效率。脉冲神经网络模拟人脑神经元的工作原理,神...

Read More
2024-05-03 talkingdev

论文:全频动态卷积,提升声音事件检测的新方法

全频动态卷积(FFDConv)是一种新型的增强2D卷积用于声音事件检测的方法。通过为每个频段生成独特的频率内核,FFDConv能够提高检测声音事件的准确性,特别是在频率特性方面。声音事件检测是一个复杂的任务,因为它涉...

Read More
2024-05-03 talkingdev

苹果CEO Tim Cook将在iPad发布会上演示新的AI功能

据预期,苹果首席执行官Tim Cook将在下周的“Let Loose”活动中预示新的人工智能特性,并在六月的全球开发者大会(WWDC)上公布更多细节。新的iPad Pro模型可能会配备M4芯片,这意味着苹果即将推出的产品可能具有先进的...

Read More
2024-05-03 talkingdev

特斯拉准备推出自己的车载语音助手

特斯拉的最新软件更新中包含了隐藏的代码,表明该公司正在为语音助手的推出做准备。目前关于新特斯拉语音助手的信息很少,但埃隆·马斯克此前曾表示,他希望特斯拉的驾驶员能够在车内进行一切操作,无需手动输入。该...

Read More
  1. Prev Page
  2. 147
  3. 148
  4. 149
  5. Next Page