漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-19 talkingdev

谷歌发布能让静态图片“活”起来的AI技术

谷歌的研究团队近日推出了一款名为VLOGGER的人工智能技术,该技术能够通过单张照片生成人物说话和活动的逼真视频。这一技术突破不仅在视觉效果上取得了显著进展,也为人机交互和虚拟现实领域带来了新的可能性。VLOGG...

Read More
2024-03-18 talkingdev

Clarity Upscaler:开源的前沿图像像素放大工具

Clarity Upscaler是一款集成了最新人工智能技术的图像放大工具,其GitHub页面已公开。该工具能够将低分辨率图像通过AI算法转换为高清晰度图像,有效改善了图像的放大过程中可能出现的模糊和像素化问题。Clarity Upsc...

Read More
2024-03-15 talkingdev

AI认证意味着认证整个经济体系

由于AI是经济中众多应用的一个重要过程,因此像物理对象一样监管AI是不可行的。AI的监管需要考虑其在整个经济体系中的作用,以及如何保护个人隐私和数据安全。

Read More
2024-03-14 talkingdev

Applied Intuition完成25亿美元D轮融资,估值达60亿美元

据报道,自动驾驶软件领导者Applied Intuition完成了2.5亿美元的D轮融资,其估值达到了60亿美元,比之前的估值增长了67%。该公司的生成式人工智能技术用于开发汽车、卡车和其他行业的软件,导致了三位数的盈利增长和...

Read More
2024-03-14 talkingdev

谷歌发布SIMA,可在3D游戏中遵循自然语言指令

谷歌DeepMind的SIMA是一个通用的AI代理,可在各种电子游戏环境中遵循自然语言指令。它标志着将AI系统变得更加多才多艺、可指导的转变。此前,AI系统只能在特定的环境中工作,现在SIMA可以在多种环境下工作,这是一项...

Read More
2024-03-13 talkingdev

Perplexity结合Yelp数据,为其聊天机器人提供本地搜索结果

Perplexity将Yelp的数据整合到其聊天机器人中,以提供用户直接丰富的本地搜索结果,包括地图、评论和餐厅详细信息,从而增强聊天机器人的回答能力。Perplexity是一家专注于自然语言处理和人工智能技术的创业公司,其...

Read More
2024-03-13 talkingdev

VideoMamba视频方案所有代码和模型开源

VideoMamba是一种解决视频理解复杂性的解决方案,它通过高效地管理本地冗余和全局依赖性来实现。该项目的创建者宣布,他们已经将代码和模型全部发布到GitHub上供公众使用。这个开源项目将提高人工智能在视频理解上的...

Read More
2024-03-12 talkingdev

互联网档案馆图书数据集开放

互联网档案馆拥有超过2亿个OCR图书页面,可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page