漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-04-01 talkingdev

Airtable AI产品发布,将人工智能融入工作流程

Airtable公司近日推出了一款名为Airtable AI的新产品,旨在将人工智能技术直接整合到用户的日常工作流程中。这款产品通过简化AI集成过程,使得用户无需深入了解复杂的人工智能算法和编程语言,也能轻松地利用AI技术...

Read More
2024-04-01 talkingdev

Qwen MoE性能匹敌7B大模型,激活参数仅三分之一

近期,一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时,成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本,还为大规模机器学习模型的可访问...

Read More
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-29 talkingdev

MRA开源-高分辨率大型语言视觉助手

研究人员最近开发出一种名为Mixture-of-Resolution Adaptation(MRA)的新技术,该技术能够显著提升人工智能在图像识别中的细节识别能力。MRA方法通过调整AI模型对图像分辨率的适应度,使其更加精准地捕捉图像中的细...

Read More
2024-03-29 talkingdev

论文:CoDA技术助力AI模型无监督领域适应能力提升

CoDA作为一种新的无监督领域适应(UDA)方法,通过在场景和图像两个层面学习差异,帮助AI模型更好地适应未标记的、具有挑战性的环境。CoDA的核心在于利用大量未标记数据来训练模型,使其在面对新场景时仍能保持高效...

Read More
2024-03-29 talkingdev

Spice:跨数据源的SQL查询利器

Spice是一个运行时工具,能够简化和加速通过SQL对一个或多个数据源的查询操作。它为开发者提供了一个统一的SQL查询接口,能够本地化实体化、加速和查询来自任何数据库、数据仓库或数据湖的数据表。Spice的出现使得构...

Read More
2024-03-29 talkingdev

未来GPU将如何实现万亿晶体管:探索高效能AI的无限可能

人工智能的近期成就归功于三个主要因素:高效机器学习算法的创新、海量数据集的支持以及半导体技术的进步带来的能源高效计算。为了保持当前的发展速度,行业需要更为强大的设备。在过去的五十年中,行业一直专注于晶...

Read More
  1. Prev Page
  2. 44
  3. 45
  4. 46
  5. Next Page