性能测试的相关内容 - 漫话开发者

2024-08-07 talkingdev

Puppeteer支持Firefox浏览器

近日，Google发布了Puppeteer 10.0版本，增加了对Firefox浏览器的支持。Puppeteer是一个Node.js库，它提供了一组API，用于通过DevTools协议控制Chromium或Chrome浏览器，可以用来高效地生成屏幕截图和PDF文件，执行...

2024-06-28 talkingdev

科技巨头们正在将注意力从大型语言模型转移到更有效的小型语言模型（SLMs），苹果和微软引入的模型具有明显较少的参数，但在基准测试中的性能却相当甚至超越了大型语言模型。OpenAI的CEO建议，我们正在超越LLMs的时...

2024-06-07 talkingdev

阿里云最新发布的旗舰语言模型Qwen 2在基准性能测试中略超越了Llama 3 70B，成为新一代语言模型的标杆。Qwen 2不仅在英语性能方面表现卓越，同时也是一个更优秀的多语言模型。这一突破性进展标志着阿里云在人工智能...

2024-05-21 talkingdev

微软近日发布了全新Surface设备，旨在挑战苹果MacBook Air的市场地位。这款Surface设备搭载了高通的Snapdragon X Elite芯片，与苹果的顶级笔记本电脑相比，在性能测试中取得了领先。微软的Copilot Plus系列PC配备了...

2024-01-25 talkingdev

这篇技术报告介绍了MMCBench，这是一个新的基准测试，旨在测试各种任务如文本到图像和语音到文本等情况下大型多模型（LMMs）的一致性和可靠性。该测试涵盖了超过100个流行模型，旨在提高读者对这些AI系统在现实世界...

2023-11-23 talkingdev

微软宣布了Windows AI Studio，这是一个供开发人员访问和配置AI模型的中心，提供了来自Azure AI Studio和Hugging Face的工具以及模型配置界面和性能测试模板等功能。英伟达更新了其TensorRT-LLM，支持GeForce RTX 30...

2023-08-09 talkingdev

该项目引入了AgentBench，一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中，结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...