漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

谷歌Veo:超一分钟的1080p分辨率视频生成新模型

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力,能够生成具有1080p分辨率的视频,且长度可以超越一分钟。在现有的视频生成技术中,这种能力是相当显著的。Veo利...

Read More
2024-05-15 talkingdev

Google I/O 2024新品发布:Gemini Flash、Veo视频生成、Imagen 3及最新助手Project Astra亮相

在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...

Read More
2024-05-14 talkingdev

Glider - 开源低延迟电子墨水显示器

Glider是一款基于树莓派的开源电子墨水显示器,旨在提供低延迟的显示体验。这个项目的目的是为了创建一个可定制的、易于使用的电子墨水显示屏,可以用于显示文本、图像和Web内容。Glider的硬件设计基于树莓派4B,配...

Read More
2024-05-14 talkingdev

MRSegmentator-MRI扫描扩展工具开源

MRSegmentator是一款新型工具,专为增强MRI扫描分割而设计。它可以有效地识别腹部、盆腔和胸部区域的40种不同器官和结构。这款新工具的开发将极大提高医疗和科研人员的工作效率,提高诊断的准确性。MRSegmentator的...

Read More
2024-05-13 talkingdev

Text2Any开源模型:Lumina引领全新一代技术革新

Lumina是一个新一代的项目,其目标是成为统一的文本到X生成模型。这个项目的训练涉及到图像、视频、音频和文本的交替,这种方法提高了下游性能。Lumina项目带来的这种全新技术,将对未来的人工智能、机器学习和深度...

Read More
2024-05-07 talkingdev

AI全球趋势:斯坦福的13张图表解析

斯坦福大学最近发布了一份新报告,对全球AI发展趋势进行了全面的追踪和解析。该报告通过13张具有代表性的图表,全方位展示了AI在各个领域的应用现状和未来发展趋势。其中,数据的收集、处理和应用被认为是推动AI发展...

Read More
2024-05-06 talkingdev

深度教程:通过视频进行交通密度分析

本深度教程将指导您如何构建一个可以报告车辆交通密度的系统。该系统使用现代计算机视觉技术来对一段时间内的车辆进行计数。通过这种方法,我们可以更准确地了解到车流量的情况,从而为城市规划、交通管理等提供有力...

Read More
2024-05-06 talkingdev

Spider模型:革新性模型助力理解上下文相关概念

Spider是一个新型的统一模型,旨在增强对上下文依赖(CD)概念的理解,如伪装物体和医疗病变等。这些概念在很大程度上依赖于视觉背景。这个模型的独特性在于,它能够理解并应对由视觉环境变化引起的复杂情况。蜘蛛模...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page