技术研究的相关内容 - 漫话开发者

2024-10-11 talkingdev

论文：深入探讨LLMs数学推理的局限性

近年来，LLMs在自然语言处理领域取得了显著进展，但在数学推理方面仍存在诸多局限性。尽管这些模型能够处理大量文本数据并生成复杂的语言输出，但它们在执行数学运算和逻辑推理时常常表现不佳。研究显示，LLMs在应对...

2024-07-04 talkingdev

近日，一项新的技术研究实现了在无代理的情况下，仅使用语言模型，就能在SWE-bench上实现24%以上的解决率。这一成果对于深化我们对SWE-bench的理解，提高其解决效率具有重要的参考价值。SWE-bench是一款广泛应用于语...

2024-05-14 talkingdev

WebLlama是一个设计精良的模型，能够浏览网页并据此回答相关问题。这种模型可用于生成高质量的预训练数据集，或者执行需要从网页查询信息的研究。WebLlama的目标是通过模型的训练，使其能够更好地理解和处理网络信息...

2024-04-11 talkingdev

最新的技术研究表明，Claude 3 Opus AI模型在说服力方面的水平与人类相差无几。该研究通过统计测试和多重比较校正来评估模型的说服力。虽然人类在说服力上略胜一筹，但这一差异在统计上并不显著，这突显了大型、复杂...

2024-04-05 talkingdev

现代变压器模型在处理数据时，每个数据单元都使用相同的预测计算量，但事实上，不同数据单元的预测难度差异很大。DeepMind的最新研究突破了这一限制，允许模型在生成过程中根据数据单元的难易程度提前退出，从而减少...

2024-03-06 talkingdev

近日，研究人员开发了一种名为Resonance RoPE的新技术，帮助LLMs更好地理解和生成比其原始训练序列更长的文本。这种方法在现有的Rotary Position Embedding（RoPE）系统上进行了改进，提高了模型在长文本上的性能，...

2024-01-26 talkingdev

苹果公司正在加强其对iPhone的人工智能(AI)技术研究，收购了多家AI公司，并增加了AI招聘岗位。苹果公司希望通过AI技术，为iPhone用户提供更好的用户体验和更为智能的功能。此外，苹果还在开发基于AI技术的新产品，以...

2023-11-29 talkingdev

研究人员开发了一种新技术，可以将图像转换为绘画，呈现出与人类类似的质量和风格。这项技术基于深度学习算法，使用神经网络来分析图像的内容和结构，并模仿人类绘画的风格和技巧。经过训练，该技术可在保留原始图像...

2023-06-23 talkingdev

声音技术研究公司ElevenLabs已经完成1900万美元的A轮融资，用于继续进行语音AI研究和产品部署，这是其使所有内容普遍可访问的使命的一部分。该轮融资由Nat Friedman、Daniel Gross和Andreessen Horowitz领投。该产品...