漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

DeepSeek发布200B+参数模型——DeepSeek-V2

talkingdev • 2024-05-07

391593 views

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,DeepSeek-V2的发布为开放模型生态系统带来了新的一员。深度学习领域的研究者可以借此机会,以该模型为基础,进行更多的研究和开发。

image

核心要点

  • DeepSeek发布了一个具有超过2000亿参数的模型DeepSeek-V2
  • DeepSeek-V2在编码和推理方面的表现极为出色
  • DeepSeek-V2的发布为开放模型生态系统带来了新的一员

Read more >