高效的相关内容 - 漫话开发者

2024-04-02 talkingdev

论文：Transformer-Lite，在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段，成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

2024-04-01 talkingdev

Airtable公司近日推出了一款名为Airtable AI的新产品，旨在将人工智能技术直接整合到用户的日常工作流程中。这款产品通过简化AI集成过程，使得用户无需深入了解复杂的人工智能算法和编程语言，也能轻松地利用AI技术...

2024-04-01 talkingdev

近期，一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时，成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本，还为大规模机器学习模型的可访问...

2024-04-01 talkingdev

人工智能公司xAI近日宣布推出其最新模型Grok 1.5，该模型具有128k的上下文长度，能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升，尤其在信息检索和编程领域表现出色。这使得开发者和...

2024-03-29 talkingdev

研究人员最近开发出一种名为Mixture-of-Resolution Adaptation（MRA）的新技术，该技术能够显著提升人工智能在图像识别中的细节识别能力。MRA方法通过调整AI模型对图像分辨率的适应度，使其更加精准地捕捉图像中的细...

2024-03-29 talkingdev

CoDA作为一种新的无监督领域适应（UDA）方法，通过在场景和图像两个层面学习差异，帮助AI模型更好地适应未标记的、具有挑战性的环境。CoDA的核心在于利用大量未标记数据来训练模型，使其在面对新场景时仍能保持高效...

2024-03-29 talkingdev

Spice是一个运行时工具，能够简化和加速通过SQL对一个或多个数据源的查询操作。它为开发者提供了一个统一的SQL查询接口，能够本地化实体化、加速和查询来自任何数据库、数据仓库或数据湖的数据表。Spice的出现使得构...

2024-03-29 talkingdev

人工智能的近期成就归功于三个主要因素：高效机器学习算法的创新、海量数据集的支持以及半导体技术的进步带来的能源高效计算。为了保持当前的发展速度，行业需要更为强大的设备。在过去的五十年中，行业一直专注于晶...