谷歌的研究团队近日推出了一款名为VLOGGER的人工智能技术,该技术能够通过单张照片生成人物说话和活动的逼真视频。这一技术突破不仅在视觉效果上取得了显著进展,也为人机交互和虚拟现实领域带来了新的可能性。VLOGG...
Read MoreClarity Upscaler是一款集成了最新人工智能技术的图像放大工具,其GitHub页面已公开。该工具能够将低分辨率图像通过AI算法转换为高清晰度图像,有效改善了图像的放大过程中可能出现的模糊和像素化问题。Clarity Upsc...
Read More由于AI是经济中众多应用的一个重要过程,因此像物理对象一样监管AI是不可行的。AI的监管需要考虑其在整个经济体系中的作用,以及如何保护个人隐私和数据安全。
Read More据报道,自动驾驶软件领导者Applied Intuition完成了2.5亿美元的D轮融资,其估值达到了60亿美元,比之前的估值增长了67%。该公司的生成式人工智能技术用于开发汽车、卡车和其他行业的软件,导致了三位数的盈利增长和...
Read More谷歌DeepMind的SIMA是一个通用的AI代理,可在各种电子游戏环境中遵循自然语言指令。它标志着将AI系统变得更加多才多艺、可指导的转变。此前,AI系统只能在特定的环境中工作,现在SIMA可以在多种环境下工作,这是一项...
Read MorePerplexity将Yelp的数据整合到其聊天机器人中,以提供用户直接丰富的本地搜索结果,包括地图、评论和餐厅详细信息,从而增强聊天机器人的回答能力。Perplexity是一家专注于自然语言处理和人工智能技术的创业公司,其...
Read MoreVideoMamba是一种解决视频理解复杂性的解决方案,它通过高效地管理本地冗余和全局依赖性来实现。该项目的创建者宣布,他们已经将代码和模型全部发布到GitHub上供公众使用。这个开源项目将提高人工智能在视频理解上的...
Read More互联网档案馆拥有超过2亿个OCR图书页面,可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...
Read More