一项新的研究论文详细揭示了AI模型Claude 3 Sonnet的内部工作机制,展示了如何通过激活与金门大桥等概念相关的“特征”来影响模型的反应。通过调整这些特征的强弱,研究人员能够引导Claude的回答包含特定元素,展示了...
Read MoreLlama cpp现已支持跨多台机器的分布式推理。这一功能目前仅限于FP16(半精度浮点数),但对于开源部署来说,这无疑是一个巨大的进步。通过分布式推理,开发者可以更高效地利用集群资源,提升模型推理的速度和效率。...
Read More近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...
Read More研究人员推出了ProtT3,这是一个旨在通过结合蛋白质语言模型(PLM)和传统语言模型(LM)来增强蛋白质文本理解能力的新框架。ProtT3框架集成了用于处理氨基酸序列的PLM,并利用一种名为Q-Former的跨模态投影器生成高...
Read MoreReworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...
Read MorePSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...
Read MoreHopfield Boosting是一种技术,该技术利用现代Hopfield能量来增强在机器学习模型中对分布外(OOD)数据的检测。在机器学习中,处理OOD数据一直是一项挑战,因为这些数据往往不符合模型的预期分布。通过Hopfield Boos...
Read MoreSqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...
Read More