漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-21 talkingdev

Penzai: 用于构建、编辑和可视化神经网络的JAX研究工具包

在人工智能领域,神经网络是一种非常重要的模型。为了提高神经网络的性能,研究人员需要使用高效的工具来构建、编辑和可视化这些网络。近日,谷歌发布了名为Penzai的JAX研究工具包,旨在帮助研究人员更轻松地完成这...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-08 talkingdev

Cohere发布Command R+:面向企业的可扩展大型语言模型

Cohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...

Read More
2024-04-08 talkingdev

Groq CEO宣布公司转型:不再销售硬件,全面拥抱AI云服务

近日,Groq公司的首席执行官宣布了一个重大战略转变,Groq将不再从事硬件销售业务,转而专注于提供AI云服务。这家曾以高性能硬件著称的科技公司,现在将精力集中在云计算和人工智能领域,旨在为客户提供更加先进的数...

Read More
2024-04-05 talkingdev

Lambda宣布5亿美元GPU云服务扩张计划

Lambda公司近日宣布,已获得5亿美元的特别债务融资,用于扩大其GPU云服务。此前,Lambda在年初已经完成了2.3亿美元的C轮融资。该扩张计划预计将进一步增强Lambda在GPU云计算市场的影响力,为客户提供更加强大的计算...

Read More
2024-04-01 talkingdev

构建商业问题的评估体系

在企业中,数据、评估和计算资源对于高性能的人工智能至关重要。评估(evals)可能是组织改进其AI产品的一个关键因素。通过构建针对商业问题的评估体系,企业能够更有效地衡量AI解决方案的性能,并据此进行优化。这...

Read More
2024-03-29 talkingdev

1比特语言模型:后训练量化技术助力在消费级GPU上运行700亿参数模型

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...

Read More
2024-03-29 talkingdev

Valkey:得到AWS、谷歌、甲骨文支持的开源Redis替代品

Valkey是一款高性能的数据结构服务器,主要用于键/值工作负载。它是流行Redis数据存储的开源分支。该项目始于Redis Labs(原Redis代码库背后的公司)将Redis更改为更具限制性的许可。Valkey分支已经汇聚了一批令人印...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page