漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-26 talkingdev

生产环境中的LLM应用评估指标

本文讨论不依赖于基准数据的评估指标。文章探讨了通用的以及特定于RAG、聊天机器人和摘要的评估方法。所有指标都附带Python实现。

Read More
2024-01-26 talkingdev

TensorDict:让你在PyTorch中更好地使用字典和张量

TensorDict是一个非常实用的小工具,它可以让你在PyTorch中使用字典和张量。使用TensorDict可以提高代码的可读性和可用性,同时保持良好的性能。 TensorDict提供了一种简单的方法来将张量转换为字典,并且可以像字...

Read More
2024-01-26 talkingdev

DiffMoog音频技术开源:结合神经网络的模块化合成器

DiffMoog是一种新的音频技术,它将模块化合成器的多功能性与神经网络的强大结合起来。它可以实现自动化声音匹配和定制声音的创建,使其成为音频合成的有价值的工具。该技术已在GitHub上发布。

Read More
2024-01-26 talkingdev

PPT2DST开源方法提高对话跟踪准确率

该项目提出了一种新的提示池方法,用于对话状态跟踪,无需在测试期间使用任务标识符即可适应新用户要求。

Read More
2024-01-26 talkingdev

音乐与语言模型评估数据集发布

Song Describer数据集包含1000多个人工编写的音乐记录描述,该数据集可帮助评估音乐与语言模型,例如音乐字幕和文本转音乐生成。

Read More
2024-01-26 talkingdev

论文:HEDNet提升自动驾驶的3D物体检测能力

HEDNet是一种新的编码器-解码器网络,旨在增强自动驾驶中的3D物体检测能力,特别是针对3D场景中稀疏点分布的挑战。该网络采用多分支设计,结合了高效的感受野对齐和多尺度信息融合技术,能够快速而准确地检测出道路...

Read More
2024-01-26 talkingdev

Fuyu-Heavy多模型表现超越Gemini Pro

Adept公司扩大了其Fuyu架构并训练了一个更大的版本,目前是MMMU上排名第三的最佳模型之一。该模型在其他任务中也表现良好(例如,在HumanEval编码基准测试中达到40+)。与其他替代方案相比,扩展此架构的挑战较少,...

Read More
2024-01-26 talkingdev

深入了解MI语言模型入门指南

机械解释性(MI)是一种研究语言模型定量价值的学科,由Neel Nanda提出。MI的特点是不需要大量的计算,因此非常易于掌握,但迄今为止取得的成果较少。本文提供了关于MI的入门指南,介绍了200个具体的开放性问题。

Read More
  1. Prev Page
  2. 312
  3. 313
  4. 314
  5. Next Page