漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-10 talkingdev

阿里巴巴推出全新大语言模型Qwen2.5

阿里巴巴云已经发布了其最新版的大语言模型 - Tongyi Qianwen Qwen2.5。这一新版本在推理、代码理解以及文本理解等方面相比于Qwen2.0有了显著的改进。Qwen2.5的推出标志着阿里巴巴在人工智能语言模型开发上取得了重...

Read More
2024-05-10 talkingdev

解读Vision Mamba:跨领域视觉任务应用及影响

本次我们将对Mamba项目进行全面的深度研究,探索其在各种视觉任务中的应用以及其不断发展的影响。Mamba项目是一个创新性的视觉技术项目,其在各个视觉任务领域中的应用逐渐被行业内人士和研究者所认可。我们将持续关...

Read More
2024-05-10 talkingdev

OpenAI公布模型规范,明确模型在各种场景下的行为预期

OpenAI最近发布了一份文件,详细阐述了公司希望其模型在各种场景下的行为表现。这份文件的公布,标志着OpenAI对于模型行为的透明度和可预测性的重视。通过明确模型的行为预期,OpenAI希望能进一步优化其模型在实际应...

Read More
2024-05-10 talkingdev

微软正研发内部模型 MAI-1,力求超越谷歌和OpenAI的主要AI模型

根据最新消息,微软正在开发一种名为MAI-1的新型人工智能模型。据悉,这款新型AI模型拥有大约5000亿的参数,目标是超越谷歌和OpenAI的主要人工智能模型。微软一直在AI领域持续进行研发和创新,这次的内部模型MAI-1的...

Read More
2024-05-09 talkingdev

OpenAI确认GPT-2-Chatbot为其新型AI模型

近期在LMSYS舞台上出现的gpt-2-chatbot已被确认为OpenAI的新型模型。该确认源于一次429速率限制错误,此错误揭示了来自OpenAI API的相关细节。GPT-2-Chatbot的出现,预示着OpenAI在人工智能领域的新进展和发展。此次...

Read More
2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ,一种新型量化算法,通过使用4位权重、8位激活和4位KV缓存,加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术,它能够减少模型的存储需求和计算复杂性。在这种情况下,QoQ算法采用了较低精度的数...

Read More
2024-05-09 talkingdev

Google DeepMind与Isomorphic Labs发布AlphaFold 3,预测蛋白质折叠能力提升50%

Google DeepMind与Isomorphic Labs联手开发了第三代AlphaFold,这是一款强大的蛋白质折叠预测模型。他们正在推出AlphaFold Server,这是一种免费的与模型交互的方式。AlphaFold 3比前两代的准确性提高了50%。它准确...

Read More
2024-05-07 talkingdev

LeroBot:HF团队开源机器人开发工具库

知名的人工智能研发团队Hugging Face近日发布了一个新的项目,该项目将机器人开发所需的常用工具进行了优雅的打包。这个新的项目在Github上开源,全球的开发者都可以免费使用和贡献。Hugging Face团队一直致力于AI领...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page