漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-26 talkingdev

WoVoGen-高质量街景视频生成器开源

世界体积感知多摄像头驾驶场景生成器(WoVoGen)是一个创新系统,旨在为自动驾驶创建逼真的街景视频。该系统使用机器学习和计算机视觉技术来生成高质量的街景视频,以帮助自动驾驶车辆更好地识别和适应不同的路况。W...

Read More
2024-02-26 talkingdev

基于标注数据的LLM评估指标

本文讨论依赖于真实标注数据的评估指标。它探讨了通用和RAG特定的评估指标。所有指标都带有Python实现或指向一个Hugging Face模型卡的链接。

Read More
2024-02-26 talkingdev

论文:AI辅助图像质量评估技术

据悉,TIER利用文本提示和从中生成的图像来评估生成的图像质量。这个新技术能够有效地帮助人们更快速,更准确地评估图像质量,提高图像相关工作的效率。

Read More
2024-02-26 talkingdev

Mozilla担任NeurIPS效率挑战的评估者

去年,Mozilla担任了效率挑战的可扩展评估者。它确保参赛者遵守比赛规则并评估模型性能。这篇文章是语言模型评估和竞争性训练方案的良好介绍。本次比赛对推动自然语言处理技术的发展具有重要意义。

Read More
2024-02-26 talkingdev

Marqo融资1250万美元,帮助企业构建生成式AI应用

向量搜索公司Marqo在由Lightspeed领导的A轮融资中筹集了1250万美元,以推进其下一代向量搜索平台的采用。Marqo的平台解锁了非结构化数据的巨大价值,覆盖了包括最终用户搜索、检索增强生成等关键企业应用,帮助企业...

Read More
2024-02-26 talkingdev

FunSearch: 利用LLM在数学科学中进行新发现

最近在《自然》杂志上介绍了一种名为FunSearch的方法,它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对,以产生可验证的解决方案,并在难以解决的cap set 和bin-packing问题...

Read More
2024-02-26 talkingdev

nxtp-采用下一个标记预测的物体识别方法

一种使用语言解码器进行物体识别的新方法。该方法涉及从图像嵌入中预测文本标记,并利用专门的非因果注意掩模。它可以实现多标签的高效并行采样。

Read More
2024-02-26 talkingdev

MMedLM-医学领域新突破,多语种医学语言模型

MMedLM 2是一种开创性的多语言语言模型,专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中,MMedLM 2的表现优于其他模型,包括GPT-4。

Read More
  1. Prev Page
  2. 259
  3. 260
  4. 261
  5. Next Page