漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-10-11 talkingdev

论文:深入探讨LLMs数学推理的局限性

近年来,LLMs在自然语言处理领域取得了显著进展,但在数学推理方面仍存在诸多局限性。尽管这些模型能够处理大量文本数据并生成复杂的语言输出,但它们在执行数学运算和逻辑推理时常常表现不佳。研究显示,LLMs在应对...

Read More
2024-07-04 talkingdev

Agentless 针对SWE-bench解决率大幅提升

近日,一项新的技术研究实现了在无代理的情况下,仅使用语言模型,就能在SWE-bench上实现24%以上的解决率。这一成果对于深化我们对SWE-bench的理解,提高其解决效率具有重要的参考价值。SWE-bench是一款广泛应用于语...

Read More
2024-05-14 talkingdev

WebLlama:基于网页浏览并本地问答的开源模型

WebLlama是一个设计精良的模型,能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集,或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练,使其能够更好地理解和处理网络信息...

Read More
2024-04-11 talkingdev

大型AI模型说服力研究结果惊人

最新的技术研究表明,Claude 3 Opus AI模型在说服力方面的水平与人类相差无几。该研究通过统计测试和多重比较校正来评估模型的说服力。虽然人类在说服力上略胜一筹,但这一差异在统计上并不显著,这突显了大型、复杂...

Read More
2024-04-05 talkingdev

DeepMind研究实现Transformer模型动态计算优化

现代变压器模型在处理数据时,每个数据单元都使用相同的预测计算量,但事实上,不同数据单元的预测难度差异很大。DeepMind的最新研究突破了这一限制,允许模型在生成过程中根据数据单元的难易程度提前退出,从而减少...

Read More
2024-03-06 talkingdev

论文:支持更长上下文长度的LLMs技术研究

近日,研究人员开发了一种名为Resonance RoPE的新技术,帮助LLMs更好地理解和生成比其原始训练序列更长的文本。这种方法在现有的Rotary Position Embedding(RoPE)系统上进行了改进,提高了模型在长文本上的性能,...

Read More
2024-01-26 talkingdev

苹果加大力度将AI技术引入iPhone

苹果公司正在加强其对iPhone的人工智能(AI)技术研究,收购了多家AI公司,并增加了AI招聘岗位。苹果公司希望通过AI技术,为iPhone用户提供更好的用户体验和更为智能的功能。此外,苹果还在开发基于AI技术的新产品,以...

Read More
2023-11-29 talkingdev

图像转绘画技术研究突破开源

研究人员开发了一种新技术,可以将图像转换为绘画,呈现出与人类类似的质量和风格。这项技术基于深度学习算法,使用神经网络来分析图像的内容和结构,并模仿人类绘画的风格和技巧。经过训练,该技术可在保留原始图像...

Read More
  1. Next Page