漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-18 talkingdev

探索LLM推理的“光速”极限

本文深入探讨了基于变换器的语言模型推理的“光速”理论极限,强调了内存带宽相较于计算能力的重要性。文章通过实例展示了推理速度主要受限于从内存中读取数据的能力,而非执行计算的速度,这对于优化和理解AI性能是一...

Read More
2024-03-18 talkingdev

AMD GPU上的多节点大型语言模型训练解析

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台,以优化模型训练的性能和...

Read More
2024-03-18 talkingdev

ScoreHMR推出基于扩散模型的3D人体姿态重建技术

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力,避免了传统优化技术,采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性,还大大减...

Read More
2024-03-18 talkingdev

OpenAI意外泄露下一代ChatGPT升级版GPT-4.5 Turbo?

近日,OpenAI疑似意外发布了一篇博客文章,该文章被Bing和DuckDuckGo索引后迅速被撤下。文章似乎是关于GPT-4.5 Turbo的公告,这是一个新的模型,其速度、准确性和可扩展性均超越了GPT-4 Turbo。缓存的描述中提到了20...

Read More
2024-03-18 talkingdev

pg_hint_plan:为PostgreSQL执行计划优化提供新策略

开源项目pg_hint_plan为开发者提供了一种新的方法,通过在SQL注释中使用提示来调整PostgreSQL的执行计划。在PostgreSQL中,规划器通过成本基优化器估算每个可能的执行计划的成本,并执行成本最低的计划。尽管Postgre...

Read More
2024-03-15 talkingdev

AI认证意味着认证整个经济体系

由于AI是经济中众多应用的一个重要过程,因此像物理对象一样监管AI是不可行的。AI的监管需要考虑其在整个经济体系中的作用,以及如何保护个人隐私和数据安全。

Read More
2024-03-15 talkingdev

ViT-CoMer:新神经网络模型增强Vision Transformers的密集预测任务能力

近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

Read More
2024-03-15 talkingdev

消费者最喜爱的Top100 Gen AI应用程序

AI本地产品和公司正在以前所未有的速度增长,并深度吸引用户。在未来的十年中,AI可能将支撑定义类别的公司。本文通过研究最受欢迎的生成AI产品的数据,揭示了消费者如何使用这项技术的模式。它关注行业的进展速度、...

Read More
2024-03-15 talkingdev

HTTP/2和HTTP/3详解

HTTP协议的第一个草案只有一种方法,即GET,没有头部或状态代码,唯一可用的数据格式是HTML。从那时起,协议已经发生了重大变化。 HTTP/3专为不稳定的连接而设计,因此需要在性能上做出一些权衡。 HTTP/2在可靠和稳...

Read More
2024-03-14 talkingdev

OpenAI计划今年发布文本到视频模型Sora

据报道,OpenAI计划在进行漏洞测试和设置安全防护措施后,于今年晚些时候公开发布其文本到视频模型Sora。Sora是一种能够将自然语言描述转化为视频的模型,这项技术在影视制作和游戏开发中有着广泛的应用前景。OpenAI...

Read More
  1. Prev Page
  2. 53
  3. 54
  4. 55
  5. Next Page