LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配(LoRA)的应用,通过隐式集成实现了在不增加传统集成方法高计算成本的情况下,仍能做出准确且校准良好的预测。这种方法不仅在精...
Read More一项新的研究论文详细揭示了AI模型Claude 3 Sonnet的内部工作机制,展示了如何通过激活与金门大桥等概念相关的“特征”来影响模型的反应。通过调整这些特征的强弱,研究人员能够引导Claude的回答包含特定元素,展示了...
Read More在软件开发过程中,测试代码的质量直接影响到软件的稳定性和可靠性。尽管人工智能(AI)在许多领域展现出其强大的能力,但在编写测试代码时,AI存在一定的局限性。AI生成的测试通常基于现有代码,缺乏人为编写时的初衷...
Read MoreCohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...
Read MoreSuno,一家致力于音乐生成的科技平台,近日宣布成功筹集1.25亿美元资金。此次融资将用于进一步开发和完善其平台,旨在实现人人都能创作音乐的愿景。Suno利用先进的人工智能技术,让用户无需具备专业音乐知识,也能轻...
Read MoreMedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...
Read More近日,MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色,甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言,还在光学字符识别(OCR)和视觉问答(visual quest...
Read More微软近日宣布,他们已成功训练出一款名为Aurora的大气预测基础模型。该模型在全球天气预测测试中,分别在5天和10天的预测准确性上,创下了新的记录。Aurora模型通过先进的机器学习算法和大量的气象数据进行训练,能...
Read More