智能的相关内容 - 漫话开发者

2024-05-27 talkingdev

LoRA-Ensemble：提升自注意力网络的预测精度

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配（LoRA）的应用，通过隐式集成实现了在不增加传统集成方法高计算成本的情况下，仍能做出准确且校准良好的预测。这种方法不仅在精...

2024-05-27 talkingdev

一项新的研究论文详细揭示了AI模型Claude 3 Sonnet的内部工作机制，展示了如何通过激活与金门大桥等概念相关的“特征”来影响模型的反应。通过调整这些特征的强弱，研究人员能够引导Claude的回答包含特定元素，展示了...

2024-05-27 talkingdev

在软件开发过程中，测试代码的质量直接影响到软件的稳定性和可靠性。尽管人工智能(AI)在许多领域展现出其强大的能力，但在编写测试代码时，AI存在一定的局限性。AI生成的测试通常基于现有代码，缺乏人为编写时的初衷...

2024-05-24 talkingdev

Cohere最新发布的Aya项目包含3种不同规模的模型，能够使用101种语言进行对话，其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目，研究人员和开发者能够更广泛地获...

2024-05-23 talkingdev

Suno，一家致力于音乐生成的科技平台，近日宣布成功筹集1.25亿美元资金。此次融资将用于进一步开发和完善其平台，旨在实现人人都能创作音乐的愿景。Suno利用先进的人工智能技术，让用户无需具备专业音乐知识，也能轻...

2024-05-23 talkingdev

MedLFQA是一个全新的基准数据集，旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据，帮助改进语言模型的回答精度。与此同时，OLAPH框架通过自动评估和偏好优化，训练大规...

2024-05-23 talkingdev

近日，MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色，甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言，还在光学字符识别（OCR）和视觉问答（visual quest...

2024-05-23 talkingdev

微软近日宣布，他们已成功训练出一款名为Aurora的大气预测基础模型。该模型在全球天气预测测试中，分别在5天和10天的预测准确性上，创下了新的记录。Aurora模型通过先进的机器学习算法和大量的气象数据进行训练，能...