计算资源的相关内容 - 漫话开发者

2024-05-29 talkingdev

无服务器的Postgres

无服务器计算是一种计算模型，其中云提供商管理了计算资源，以便根据需要自动分配和释放资源。最近，一个名为Up的初创公司推出了一项名为“无服务器Postgres”的新服务，该服务提供了一种完全托管的PostgreSQL数据库解...

2024-05-27 talkingdev

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配（LoRA）的应用，通过隐式集成实现了在不增加传统集成方法高计算成本的情况下，仍能做出准确且校准良好的预测。这种方法不仅在精...

2024-05-21 talkingdev

LeMeViT是一种新的方法，通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息，从而显著提高推理速度。与传统的视觉Transformer相比，LeMeViT在保持高精度的同时，大幅减少了计...

2024-05-17 talkingdev

人工智能公司Hugging Face宣布，将免费提供价值1000万美元的共享图形处理器（GPUs）资源，以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...

2024-05-04 talkingdev

近日，gpudeploy.com推出了全新的GPU部署服务，该服务为用户提供了一种简单，快速的方式来部署和使用GPU。用户只需上传其模型和数据，gpudeploy.com即可为其提供简单易用的GPU计算资源，就像Airbnb为租房者提供房源...

2024-05-01 talkingdev

正在从加密转向AI的Cognition Labs，正寻求20亿美元的估值为其AI编码工具Devin融资。在AI初创公司估值飙升的趋势中，Cognition的成功反映了行业的增长以及在数据和计算资源上进行重大投资的重要性。像Google和Micros...

2024-04-28 talkingdev

Llama3是一种革命性的新技术，它通过使用Unsloth进行微调，可以在保持相同的计算效率的同时，显著降低VRAM的使用量。最近的研究表明，使用Unsloth微调Llama3可以使上下文长度增长六倍，这比HF的flash attention技术...

2024-04-15 talkingdev

xAI公司近日宣布，其最新旗舰模型Grok-1.5已具备视觉功能，与现有最先进模型相比肩，甚至在某些方面超越。Grok-1.5的推出，标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...