漫话开发者 - UWL.ME Mobile
Loading more...
漫话开发者 - UWL.ME Mobile

近日,由Saksham和Ishan共同创立的YC W26项目Cardboard正式亮相,这是一款革命性的AI视频编辑工具。用户只需用自然语言描述需求,如“从这段原始素材中制作一个60秒的回顾”或“将其剪成20秒的广告”,Cardboard便能自动生成初步剪辑时间线,供用户进一步精修。该工具旨在解决个人和企业积压大量原始视频素材(如产品演示、客户访谈、旅行录像等)却因传统剪辑流程繁琐而无法有效利用的痛点。传统流程涉及数小时的手动浏览素材、排列片段、同步音乐、导出、分享及收集反馈,循环往复,效率低下。Cardboard基于WebCodecs/WebGL2构建了定制化的硬件加速渲染器,完全在浏览器客户端运行,无需服务器端渲染或插件。其视频理解任务通过一系列云端视觉语言模型与传统机器学习模型处理,并利用第三方基础模型进行智能体编排。自去年11月以来,Cardboard已迭代13个版本,支持多轨道时间线、关键帧动画、镜头检测、基于打击乐检测的节拍同步、画外音生成、声音克隆、背景移除、支持多语言且能感知画面主体空间位置的字幕,以及可导出为Premiere Pro、DaVinci Resolve、Final Cut Pro XML格式,方便用户迁移至现有专业工具。团队未来计划开发实时协作功能(类似视频Git)以减少低效的反馈循环,并最终构建一个能学习用户编辑模式、预测并建议下一步低熵操作(类似于代码编辑器Cursor的Tab补全,但针对时间线操作)的预测引擎。他们认为,当前的视频创作工具如同21世纪初的开发工具:本地优先、缺乏协作且反馈循环缓慢。Cardboard的推出,标志着视频编辑正朝着更智能、更协作、更易用的方向发展。

核心要点

  • Cardboard是一款AI驱动的视频编辑器,用户通过自然语言指令即可从原始素材快速生成初步剪辑,大幅降低视频制作门槛。
  • 该工具完全在浏览器中运行,采用客户端渲染技术,并整合了云端视觉语言模型、传统ML模型及第三方基础模型来实现智能视频理解和编排。
  • 未来路线图包括开发实时协作(视频Git)系统和能学习用户习惯、智能预测编辑操作的AI引擎,旨在彻底改变视频制作的协作与效率范式。

Read more >