世界体积感知多摄像头驾驶场景生成器(WoVoGen)是一个创新系统,旨在为自动驾驶创建逼真的街景视频。该系统使用机器学习和计算机视觉技术来生成高质量的街景视频,以帮助自动驾驶车辆更好地识别和适应不同的路况。W...
Read More本文讨论依赖于真实标注数据的评估指标。它探讨了通用和RAG特定的评估指标。所有指标都带有Python实现或指向一个Hugging Face模型卡的链接。
Read More去年,Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。
Read More向量搜索公司Marqo在由Lightspeed领导的A轮融资中筹集了1250万美元,以推进其下一代向量搜索平台的采用。Marqo的平台解锁了非结构化数据的巨大价值,覆盖了包括最终用户搜索、检索增强生成等关键企业应用,帮助企业...
Read More最近在《自然》杂志上介绍了一种名为FunSearch的方法,它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对,以产生可验证的解决方案,并在难以解决的cap set 和bin-packing问题...
Read More一种使用语言解码器进行物体识别的新方法。该方法涉及从图像嵌入中预测文本标记,并利用专门的非因果注意掩模。它可以实现多标签的高效并行采样。
Read MoreMMedLM 2是一种开创性的多语言语言模型,专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中,MMedLM 2的表现优于其他模型,包括GPT-4。
Read More