漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

LWM-视频语言模型可回答长达小时的视频问题

talkingdev • 2024-02-16

623879 views

近期,一种新型的视频语言模型已经问世,可以回答长达数百万词的视频问题。该模型采用环形关注机制和精细调整的7B参数模型,能够在检索基准测试中表现极其准确,胜过商业化视频语言模型。

核心要点

  • 该模型可以回答长达数百万词的视频问题
  • 采用环形关注机制和精细调整的7B参数模型
  • 在基准测试中表现极其准确,胜过商业化视频语言模型

Read more >