漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-23 talkingdev

Qlary AI:无需代码部署呼叫中心人工智能

Qlary AI是一款能够帮助企业在不需要编写代码的情况下部署呼叫中心人工智能的产品。这款产品可以自动完成呼叫分类、意图分析和语音识别等任务,同时还能在客户与客服人员之间建立自然交互。Qlary AI还能够通过与第三...

Read More
2024-01-23 talkingdev

提升视觉基础模型性能:ViSFT开源

针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...

Read More
2024-01-23 talkingdev

论文:RSHazeNet,更清晰的遥感图像

日前,RSHazeNet发布,该框架旨在从遥感图像中去除雾霾。该工具使用创新模块更好地理解和保留图像中的重要细节,使其更清晰、更有用于分析。RSHazeNet框架具有较高的普适性,适用于各种遥感图像去雾任务。该工具的发...

Read More
2024-01-23 talkingdev

微软利用AI发现了新的电池材料

微软和太平洋西北国家实验室利用人工智能和大规模云计算发现了一种新的电池材料,这种材料是一种新型的固态电解质。与锂离子电池相比,它可能导致电池更不容易爆炸。虽然还需要测试材料是否是锂离子电池的可行替代品...

Read More
2024-01-23 talkingdev

HuggingFace开源数据过滤库Datatrove

HuggingFace发布了Datatrove,这是一个用于过滤大型文本数据集的库。它具有许多有用的原语和用于文本过滤的完整并行管道。可在C4中使用Gopher质量过滤器的示例。

Read More
2024-01-23 talkingdev

HuggingFace发布针对3D并行的代码库Nanotron

近日,HuggingFace发布了一个名为Nanotron的小型而强大的库,用于训练具有3D并行性的模型。这意味着它将数据、模型和模型中的层/张量分割开来。前两种并行性在PyTorch等库中得到了很好的支持。然而,将模型张量分割...

Read More
2024-01-23 talkingdev

开源图像字幕软件,帮助AI训练更智能

GitHub最近推出了一款图像字幕软件,能够帮助用户为图像添加字幕以便更好地进行AI训练。这款软件非常轻巧,易于使用,可以快速准确地为图像添加字幕,提高AI的训练效率。该软件支持多种格式的图像文件,包括PNG、JPE...

Read More
2024-01-23 talkingdev

论文:BriVIS开放词汇视频实例分割

研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。

Read More
  1. Prev Page
  2. 319
  3. 320
  4. 321
  5. Next Page