漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-20 talkingdev

MoonDream-基于WebGPU实现在线运行大模型

MoonDream在最新的实验中,利用WebGPU的推断功能,直接在网络上运行了一个小型的MoonDream VLM。这一实验的成功,标志着MoonDream在提升其在线服务能力方面又迈出了重要的一步。WebGPU是一种新型的网络图形技术,它...

Read More
2024-05-17 talkingdev

轻巧的视觉语言模型:Xmodel-VLM开源

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用,这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法,它优化了视觉和语言之间的协同工...

Read More
2024-05-17 talkingdev

Hugging Face向AI开发者提供价值1000万美元的免费计算资源

人工智能公司Hugging Face宣布,将免费提供价值1000万美元的共享图形处理器(GPUs)资源,以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...

Read More
2024-05-10 talkingdev

一次缓存,永久有效:YOCO架构再塑GPU内存需求

YOCO架构是一种具有全局注意力能力的解码器-解码器模型,能有效地降低GPU内存需求。它包含一个自解码器和一个交叉解码器,使得关键-值对的缓存和复用更加高效。与传统的Transformer相比,YOCO在推理内存、延迟和吞吐...

Read More
2024-05-04 talkingdev

GPUDeploy:为GPU提供类Airbnb共享服务

近日,gpudeploy.com推出了全新的GPU部署服务,该服务为用户提供了一种简单,快速的方式来部署和使用GPU。用户只需上传其模型和数据,gpudeploy.com即可为其提供简单易用的GPU计算资源,就像Airbnb为租房者提供房源...

Read More
2024-05-03 talkingdev

用WebGPU构建免费的浏览器内Llama 3聊天机器人

最近,一位开发者使用WebGPU构建了一个免费的浏览器内Llama 3聊天机器人。Llama 3聊天机器人是一个人工智能聊天机器人,能够回答用户的问题,甚至能够进行基础的对话。与其他聊天机器人不同的是,Llama 3聊天机器人...

Read More
2024-05-02 talkingdev

GPU供应商Coreweave完成11亿美元融资,估值飙升至190亿美元

GPU供应商Coreweave近期完成了11亿美元的融资,使得该公司估值达到了惊人的190亿美元。Coreweave是一家专注于租赁超级集群的公司,为各种行业提供高性能计算解决方案。此次融资对于Coreweave的发展无疑是一大利好,...

Read More
2024-05-01 talkingdev

QUICK:加速LLM的新CUDA内核开源

QUICK是一套新的优化CUDA内核,通过解决内存问题,提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升,使AI模型运行更快,效率更高。QUICK的出现,无疑为AI领域带来了新的可能性,通过优化内存处理方式...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page