漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-28 talkingdev

VSP-LLM可视化语音识别框架开源

Visual Speech Recognition with Language Models(VSP-LLM)框架在视觉语音识别和翻译中引入了新的方法,通过集成LLMs来高效处理视频输入,通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。

Read More
2023-12-12 talkingdev

LLM原理的可视化呈现

LLM可视化是一个网站,用于展示nano-gpt模型如何将6个字母的序列按字母顺序排序。nano-gpt模型是由85,000个参数组成的模型,其基础是GPT-2,该模型可用于生成自然语言文本。该网站使用了交互式的可视化工具,用户可...

Read More
2023-12-05 talkingdev

LLM可视化(网站)

LLM可视化是一个展示nano-gpt模型的网站,该模型有85000个参数。它展示了该模型如何将一个包含6个字母的序列按字母顺序排列。此网站可以帮助人们更好地了解和理解自然语言处理中的模型和算法。

Read More