漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-01 talkingdev

Meta发布新的AI基准FACET,旨在评估AI模型的“公平性”

Meta最近发布了一种新的人工智能基准,名为FACET。这种基准旨在评估AI模型在图像和视频中分类和检测物体,包括人物的“公平性”。公平性在AI领域是一个重要的话题,因为AI模型往往会复制并放大现实世界的偏见。通过FAC...

Read More
2023-08-31 talkingdev

Google Pixel 8:最新泄露与传言汇总

看起来谷歌正准备迎接十月份的硬件发布会。本页面收集了关于即将发布的Pixel手机系列的泄露信息的文章。Pixel发布会定于10月4日举行。设备的更新包括改进的相机应用界面、音频魔术橡皮擦和清晰模糊视频的方法。似乎...

Read More
2023-08-30 talkingdev

开源工具DSPy:可提升语言模型的理解和学习能力

GitHub近日发布了新工具DSPy,这是一套简洁的Python模块集,能够统一调动和微调语言模型(LMs)的技术,并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现,同时也使得...

Read More
2023-08-29 talkingdev

开源视觉-语言模型:识别面部表情

本研究公开了一个新的模型-DFER-CLIP,该模型对CLIP模型进行了改进,专门用于识别现实世界中变化的面部表情。CLIP模型是一个多模态的人工智能模型,它能够理解图像和文本之间的关系。这个新的DFER-CLIP模型,通过增...

Read More
2023-08-25 talkingdev

人类反馈改善语言模型:DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而,使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明,可以直接针对人类偏好进行优化,从而绕过奖励模型。借助基于文本的强化学习,你可...

Read More
2023-08-25 talkingdev

论文:LiDAR点追踪3D物体的新方法

大多数计算机视觉工具在使用LiDAR点追踪3D物体时,由于干扰或未注意到长期运动,常常遇到困难。为了解决这些问题,MTM-Tracker混合使用了两种方法,并分为两个阶段进行工作。在第一阶段,MTM-Tracker使用基于模型的...

Read More
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
  1. Prev Page
  2. 30
  3. 31
  4. 32
  5. Next Page