漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-05 talkingdev

ragas:助力评估检索增强生成管道的框架

ragas是一个框架,它可以帮助你评估你的检索增强生成(Retrieval Augmented Generation,简称RAG)管道,这是一类使用外部数据来增强LLM(语言模型学习)上下文的应用程序。RAG管道是近年来人工智能领域的重要研究方...

Read More
2023-09-04 talkingdev

论文:深度学习助力全能音效移除系统的构建

近期,音频深度学习领域焕发新生。通过使用一个分类器,接着是特定效果的模块,我们可以构建一个全能系统,逐步从已混合的音频中移除混响或延迟等效果。这种技术不仅能够增强音频处理的效率,还能改进音频的整体质量...

Read More
2023-08-30 talkingdev

论文:利用扩散模型提升安全性:DiffSmooth模型稳健新纪元

科研人员正在探索一种名为“扩散模型”的新方法,以增强已进行训练的模型的强度。这种新方法被命名为“DiffSmooth”,通过使用扩散清理数据,然后利用特殊的平滑过程让模型变得更加可靠。这一创新方法的提出,意味着我们...

Read More
2023-08-30 talkingdev

开源工具DSPy:可提升语言模型的理解和学习能力

GitHub近日发布了新工具DSPy,这是一套简洁的Python模块集,能够统一调动和微调语言模型(LMs)的技术,并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现,同时也使得...

Read More
2023-08-29 talkingdev

开源视觉-语言模型:识别面部表情

本研究公开了一个新的模型-DFER-CLIP,该模型对CLIP模型进行了改进,专门用于识别现实世界中变化的面部表情。CLIP模型是一个多模态的人工智能模型,它能够理解图像和文本之间的关系。这个新的DFER-CLIP模型,通过增...

Read More
2023-08-29 talkingdev

nrhints-基于少量照片实现3D物体光照效果

近期,一项新的研究成果引起了众多科技爱好者的关注。该研究以创新的方式介绍了如何利用少量照片来重现光线与3D物体的交互效果。与旧有技术不同的是,我们的系统巧妙地利用了关于阴影和高光的提示,从而使其能够更有...

Read More
2023-08-28 talkingdev

FineRecon:深度感知前馈网络实现细节丰富的3D重建

苹果公司最新的研究成果在3D物体重建这一具有挑战性的问题上展现了惊人的性能。这项名为FineRecon的新技术,利用深度感知前馈网络,将2D图像转化为精细的3D模型。这一突破性的技术有望在许多领域得到应用,包括虚拟...

Read More
2023-08-24 talkingdev

微软试验将AI融入Windows基础应用

微软正处于初期阶段,正在试验为内置在Windows中的应用程序如照片、截图工具甚至是画图工具等添加新的AI功能。这一举动旨在通过提供更智能的工具来提升用户体验。例如,新的AI功能可能会帮助用户更有效地编辑和管理...

Read More
  1. Prev Page
  2. 35
  3. 36
  4. 37
  5. Next Page