数据的相关内容 - 漫话开发者

2024-03-18 talkingdev

探索LLM推理的“光速”极限

本文深入探讨了基于变换器的语言模型推理的“光速”理论极限，强调了内存带宽相较于计算能力的重要性。文章通过实例展示了推理速度主要受限于从内存中读取数据的能力，而非执行计算的速度，这对于优化和理解AI性能是一...

2024-03-18 talkingdev

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台，以优化模型训练的性能和...

2024-03-18 talkingdev

ScoreHMR公司近日推出了一种新颖的3D人体姿态和形状重建方法。该技术利用扩散模型的强大能力，避免了传统优化技术，采用了得分引导方式将人体模型与图像观测数据对齐。这一创新方法不仅提高了重建的准确性，还大大减...

2024-03-18 talkingdev

近日，OpenAI疑似意外发布了一篇博客文章，该文章被Bing和DuckDuckGo索引后迅速被撤下。文章似乎是关于GPT-4.5 Turbo的公告，这是一个新的模型，其速度、准确性和可扩展性均超越了GPT-4 Turbo。缓存的描述中提到了20...

2024-03-18 talkingdev

开源项目pg_hint_plan为开发者提供了一种新的方法，通过在SQL注释中使用提示来调整PostgreSQL的执行计划。在PostgreSQL中，规划器通过成本基优化器估算每个可能的执行计划的成本，并执行成本最低的计划。尽管Postgre...

2024-03-15 talkingdev

由于AI是经济中众多应用的一个重要过程，因此像物理对象一样监管AI是不可行的。AI的监管需要考虑其在整个经济体系中的作用，以及如何保护个人隐私和数据安全。

2024-03-15 talkingdev

近日，一项名为ViT-CoMer的神经网络模型问世，增强了Vision Transformers（ViT）在密集预测任务中的表现，而无需预训练。这项研究由卡内基梅隆大学的学者领导，他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

2024-03-15 talkingdev

AI本地产品和公司正在以前所未有的速度增长，并深度吸引用户。在未来的十年中，AI可能将支撑定义类别的公司。本文通过研究最受欢迎的生成AI产品的数据，揭示了消费者如何使用这项技术的模式。它关注行业的进展速度、...

2024-03-15 talkingdev

HTTP协议的第一个草案只有一种方法，即GET，没有头部或状态代码，唯一可用的数据格式是HTML。从那时起，协议已经发生了重大变化。 HTTP/3专为不稳定的连接而设计，因此需要在性能上做出一些权衡。 HTTP/2在可靠和稳...

2024-03-14 talkingdev

据报道，OpenAI计划在进行漏洞测试和设置安全防护措施后，于今年晚些时候公开发布其文本到视频模型Sora。Sora是一种能够将自然语言描述转化为视频的模型，这项技术在影视制作和游戏开发中有着广泛的应用前景。OpenAI...