GPU的相关内容 - 漫话开发者

2024-05-20 talkingdev

MoonDream-基于WebGPU实现在线运行大模型

MoonDream在最新的实验中，利用WebGPU的推断功能，直接在网络上运行了一个小型的MoonDream VLM。这一实验的成功，标志着MoonDream在提升其在线服务能力方面又迈出了重要的一步。WebGPU是一种新型的网络图形技术，它...

2024-05-17 talkingdev

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用，这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法，它优化了视觉和语言之间的协同工...

2024-05-17 talkingdev

人工智能公司Hugging Face宣布，将免费提供价值1000万美元的共享图形处理器（GPUs）资源，以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...

2024-05-10 talkingdev

YOCO架构是一种具有全局注意力能力的解码器-解码器模型，能有效地降低GPU内存需求。它包含一个自解码器和一个交叉解码器，使得关键-值对的缓存和复用更加高效。与传统的Transformer相比，YOCO在推理内存、延迟和吞吐...

2024-05-04 talkingdev

近日，gpudeploy.com推出了全新的GPU部署服务，该服务为用户提供了一种简单，快速的方式来部署和使用GPU。用户只需上传其模型和数据，gpudeploy.com即可为其提供简单易用的GPU计算资源，就像Airbnb为租房者提供房源...

2024-05-03 talkingdev

最近，一位开发者使用WebGPU构建了一个免费的浏览器内Llama 3聊天机器人。Llama 3聊天机器人是一个人工智能聊天机器人，能够回答用户的问题，甚至能够进行基础的对话。与其他聊天机器人不同的是，Llama 3聊天机器人...

2024-05-02 talkingdev

GPU供应商Coreweave近期完成了11亿美元的融资，使得该公司估值达到了惊人的190亿美元。Coreweave是一家专注于租赁超级集群的公司，为各种行业提供高性能计算解决方案。此次融资对于Coreweave的发展无疑是一大利好，...

2024-05-01 talkingdev

QUICK是一套新的优化CUDA内核，通过解决内存问题，提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升，使AI模型运行更快，效率更高。QUICK的出现，无疑为AI领域带来了新的可能性，通过优化内存处理方式...