漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-28 talkingdev

苹果、微软缩小AI模型以提升性能

科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型(SLMs),苹果和微软引入的模型具有明显较少的参数,但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议,我们正在超越LLMs的时...

Read More
2024-06-27 talkingdev

医疗模型与GPT 4达到同等水平

这款7b模型在医疗数据上进行了训练,当由医生进行人类偏好评估时,其与GPT-4打成了平手。这表明了医疗领域AI技术的强大进步。这款模型的性能与GPT-4相当,显示出其在理解和解析医疗数据方面的强大能力。这项成就不仅...

Read More
2024-06-27 talkingdev

论文:DeepMind通过联合样本选择进行数据策划,进一步加速多模态学习

在预训练中,如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本,仍然能匹配各种任务的最新技术。在这个过程中,他们采用了一种名为“联合样...

Read More
2024-06-27 talkingdev

深度挖掘:稀疏自编码器(SAEs)的应用与实践

Golden Gate Claude 是一个出色的案例,展示了如何使用SAEs(稀疏自编码器)进行模型的驾驭和解读。该工作为我们提供了一个直观的解释,解释了它是如何工作的,并提供了一些用于训练这些模型的示例代码。自编码器是...

Read More
2024-06-27 talkingdev

紧急通知:Polyfill.io代码遭恶意篡改,超十万网站受影响

Polyfill.io,一个广泛用于提高旧版浏览器兼容性的JavaScript代码库,近日被发现被恶意代码感染。目前,已有超过十万个网站使用该服务。这些网站建议立即移除相关代码以避免潜在的安全威胁。据悉,该问题源于今年早...

Read More
2024-06-26 talkingdev

利用RAG使本地LLM语音助手更快更具扩展性

研究人员已经发现,通过分类数据、预计算嵌入以及动态生成示例,可以使LLM语音助手更加高效和可扩展。他们利用RAG(Retrieval Augmented Generation)系统对语音助手进行优化,提高了其性能和扩展性。RAG是一种典型...

Read More
2024-06-26 talkingdev

Lamini如何解决LLM的幻觉问题

Lamini已经成功开发出了名为'记忆调整'的技术,该技术可以有效地减少95%的幻觉现象。这项技术的主要作用在于,能够将特定的数据更有效地嵌入到模型中,而不会影响到模型的一般知识。通过这种方式,Lamini不仅解决了L...

Read More
2024-06-26 talkingdev

Imbue公司以其训练出的70B模型匹敌GPT-4

Imbue公司成功训练并发布了一款极其强大的70B语言模型。这款模型采用了Imbue自家的优化器,以及一些出色的数据过滤技术,训练过程中没有出现任何损失峰值。这表明该公司在技术上取得了显著的突破,为人工智能语言模...

Read More
  1. Prev Page
  2. 27
  3. 28
  4. 29
  5. Next Page