漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-03 talkingdev

LlaRA-大模型在机器人技术中的应用

LLaRA是一个使用大型语言模型(LLM)来通过对话式的指令-响应对提高机器人行动政策的框架。通过整合视觉输入,这些视觉语言模型(VLM)处理状态信息并生成最优的政策决策。LLM的使用增强了机器人的理解和应对能力,...

Read More
2024-06-26 talkingdev

LLM雷达:帮助你在AI大模型保持领先的免费工具

LLM雷达是一款免费的工具,它可以扫描新的LLM并直接发送到你的邮箱,让你在AI游戏中无需任何努力就能领先。这款产品的主要目标是帮助用户在快速发展且竞争激烈的人工智能领域中保持领先地位。使用LLM雷达,你可以接...

Read More
2024-06-25 talkingdev

本地语音聊天机器人June:结合Ollama、Hugging Face Transformers和Coqui TTS Toolkit的能力

最近,一款名为“June”的本地语音聊天机器人引起了业界的注意。这款聊天机器人结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的技术,实现了高效的人工智能对话功能。“June”通过这三种强大的工具,可以...

Read More
2024-06-03 talkingdev

muP:提升稀疏模型训练性能的革命性工具

muP 是一种被所有前沿模型实验室广泛使用的强大工具,用于将小模型上调优的超参数转移到更大、更昂贵的训练任务中。本文探讨了如何将这种技术应用于稀疏模型,从而显著提升训练性能,同时降低计算成本。通过muP,研...

Read More
2024-05-24 talkingdev

SirLLM:增强大模型长期记忆的方法开源

近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...

Read More
2024-05-20 talkingdev

MoonDream-基于WebGPU实现在线运行大模型

MoonDream在最新的实验中,利用WebGPU的推断功能,直接在网络上运行了一个小型的MoonDream VLM。这一实验的成功,标志着MoonDream在提升其在线服务能力方面又迈出了重要的一步。WebGPU是一种新型的网络图形技术,它...

Read More
2024-05-03 talkingdev

开源实现扩展LLM大模型到128K上下文长度

一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...

Read More
2024-04-12 talkingdev

大模型如何理解概念:研究揭示层次处理机制

近期一项研究深入探讨了大型语言模型中不同概念的理解方式。该研究发现,在这些模型中,简单任务通常由较浅的层次处理,而更复杂的任务则需要更深层次的处理能力。这一发现有助于我们更好地理解人工智能在处理信息时...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page