漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-09 talkingdev

ChemFlow:利用先进的生成模型探索化学空间

ChemFlow是一个新的框架,旨在通过使用深度生成模型高效地导航化学空间,从而提高分子科学的效率。这种新型框架的出现,使化学研究人员能够在化学空间中更加精准地进行探索和导航,从而为分子科学领域的研究和发展开...

Read More
2024-05-08 talkingdev

人工智能攀岩教练:根据身体状况可可视化攀爬任意路线

近日,一家名为Klimb的初创公司推出了一款名为“Klimb AI”的攀岩教练软件,可以根据用户的身体状况和技能水平,为其呈现出可视化的攀岩路线。据悉,该软件使用计算机视觉技术,分析攀岩者的身体姿势和动作,以及攀爬...

Read More
2024-05-08 talkingdev

AI现状:13张图表一览无余

斯坦福大学最新的一份报告跟踪了全球的人工智能趋势。报告通过13张图表全面展示了人工智能的现状,深入剖析了目前AI技术的发展趋势,涵盖了各种AI应用场景和技术挑战。该报告不仅对AI行业进行了全面的梳理,更是提供...

Read More
2024-05-07 talkingdev

AI全球趋势:斯坦福的13张图表解析

斯坦福大学最近发布了一份新报告,对全球AI发展趋势进行了全面的追踪和解析。该报告通过13张具有代表性的图表,全方位展示了AI在各个领域的应用现状和未来发展趋势。其中,数据的收集、处理和应用被认为是推动AI发展...

Read More
2024-05-07 talkingdev

ml-rpm-bench: 视觉-语言模型在视觉推理方面的限制评估

像GPT-4V这样的视觉-语言模型在理解和与图像和文本交互方面正在快速发展。然而,最近的一项研究揭示了它们在视觉推理上的重大限制。研究人员使用复杂的视觉难题,如智商测试中的难题,来测试这些模型,并发现它们在...

Read More
2024-05-07 talkingdev

使用Morph-Tokens增强视觉能力

研究人员已经开发出“Morph-Tokens”来提高AI的视觉理解和图像生成能力。这些令牌将用于理解的抽象概念转换为用于图像创建的详细视觉,利用MLLM框架的先进处理能力。Morph-Tokens的开发,不仅能够提高AI的图像理解和生...

Read More
2024-05-07 talkingdev

Vibe-Eval开源:评估多模态聊天模型基准测试

Vibe-Eval是一个新推出的基准测试,专为测试多模态聊天模型而设计。它包含了269项视觉理解提示,其中包括100项特别具有挑战性的提示。这些视觉理解提示的设计,力求能够全面、深入地评估和测试多模态聊天模型的性能...

Read More
2024-05-07 talkingdev

论文:利用遮蔽图像模型进行深度假象检测

最新的研究提出一种新的深度假象检测方法,这种方法主要关注于遮蔽图像模型,尤其是在频率域中。这种方法与传统的深度假象检测方法有所不同,对于识别由最新的AI生成技术制作的合成图像表现出显著的改进。遮蔽图像模...

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page