AR的相关内容 - 漫话开发者

2024-07-19 talkingdev

GraphMuse-使用图神经网络进行符号音乐任务

GraphMuse是一个新的框架，专门设计用来增强在符号音乐任务中使用图神经网络（GNNs）的效果。它通过将音乐符号转化为图结构，然后使用图神经网络进行处理，以提高音乐信息的分析和识别准确度。GraphMuse架构的独特之...

2024-07-19 talkingdev

GitHub近日发布了一款命令行实用工具——LLM2sh。这项工具的主要功能在于利用LLMs技术，将用户的普通语言请求转化为shell命令。通过LLM2sh，用户可以用日常语言来控制和指导计算机操作，提升了命令行的便利性和亲和力...

2024-07-19 talkingdev

E5-V是一种新的框架，其改编了多模态大型语言模型（MLLMs）以创建全球多模态嵌入。通过使用提示，它弥补了不同输入类型之间的差距，而无需进行微调就实现了在多模态任务中的令人印象深刻的性能。这一全球多模态嵌入...

2024-07-19 talkingdev

研究人员提出了针对大型语言模型（LLMs）的补丁级别训练，以提高训练效率。补丁级别训练是一种新的技术，目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别，提高了模型的训练效率，...

2024-07-19 talkingdev

在构建基于数据的聊天应用程序中，检索是非常重要的一部分。然而，系统对检索内容的格式通常十分敏感。构建内容的语言地图（例如，维基百科风格的词条），并使用该地图进行检索，可以显著提高聊天性能。Mutable AI就...

2024-07-19 talkingdev

近日，一种名为“可靠且高效的概念擦除”（Reliable and Efficient Concept Erasure，简称RECE）的新型方法引起了人们的广泛关注。这种方法可以在仅需3秒的时间内，将不适当的内容从扩散模型中擦除，而无需额外的精细...

2024-07-19 talkingdev

OpenAI近日推出了一款新型小型模型——GPT-4o Mini，目标是替代现有的GPT-3.5模型。GPT-4o Mini在MMLU（Mixed Multi-Level Understanding）上的得分为82，这对于低成本模型来说是相当合理的表现。OpenAI一直致力于开发...

2024-07-19 talkingdev

Mistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练，展现出了强大的多语言和英语处理能力。值得一提的是，Nemo 12B还支持128k的上下文。这种强大的性能，无疑...