漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-07 talkingdev

PerceptionCLIP,开源增强zero-shot击图像分类方法

一项最新研究介绍了PerceptionCLIP,这是一种模拟人类视觉感知过程的两步图像分类方法,旨在更好地利用CLIP,一种突出的视觉语言模型。首先,通过识别背景属性并利用它们区分前景物体,这种新方法在图像分类任务中提...

Read More
2023-08-02 talkingdev

论文:ToolLlama-语言模型与API的强大结合

工具使用是一个范例,其中语言模型生成触发某些API被调用的词汇,其输出作为令牌被反馈到语言模型中。这意味着语言模型能够使用计算器,网络浏览器,甚至编码环境。随着最近强大的开源语言模型的发布,您可以收集40k...

Read More
2023-07-31 talkingdev

Stack Overflow攀升到生成性AI世界,推出OverflowAI

为了增强搜索能力并帮助开发者,Stack Overflow正在将生成性AI特征集成到其平台中。OverflowAI将于8月份以alpha版本推出。这些工具包括一个Visual Studio Code扩展和Slack集成。通过使用AI技术,Stack Overflow希望...

Read More
2023-07-28 talkingdev

HQTrack-高质量视频对象追踪和分割开源框架

这个仓库介绍了HQTrack,这是一个高质量的视频对象追踪框架,利用先进的感知算法来追踪单个和多个对象,同时精细化他们的边界。尽管只在有限的数据集上进行训练,HQTrack通过在不使用任何额外的数据增强或模型集成的...

Read More
2023-07-28 talkingdev

Stack Overflow推出OverflowAI, 加强平台AI整合功能

Stack Overflow近日宣布推出OverflowAI计划,计划将生成式人工智能技术整合到平台中。该计划包括增加新的搜索能力、能够在几分钟内创建和整理知识库、Slack集成、Visual Studio Code插件以及专门的AI资源和专家回答...

Read More
2023-07-27 talkingdev

增强版视频对象分割方法:SgMg(GitHub 仓库)

这个GitHub仓库介绍了一个名为SgMg的新方法,改进了视频中所提到的对象分割过程。该方法解决了特性漂移的问题,利用视觉细节更好地优化分割。新方法还使得视频中多个对象的同时分割成为可能,使得这个过程更加快速和...

Read More
2023-07-25 talkingdev

微软的BingChat向Chrome和Safari用户开放

微软的AI聊天机器人,Bing Chat,正在向非微软浏览器用户扩展。这次扩展将使微软的ChatGPT类AI聊天机器人可以服务于更广泛的用户群体,因为它之前只在微软的产品中,比如Bing移动应用和Microsoft Edge浏览器中向用户...

Read More
2023-07-20 talkingdev

引人注目的手部物体接触数据集开源

估计手部与物体接触的时机对于增强现实/虚拟现实和机器人技术来说是一项关键挑战。在深度学习领域,数据就是女王。这个新的大规模数据集包含了数百万帧的标注数据,可用于执行各种任务,如手部重构、模拟物体运动等...

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page