漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-01 talkingdev

论文:SliceGPT高效简化大型语言模型的新方法

SliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...

Read More
2024-02-01 talkingdev

OpenAI CEO Sam Altman表示GPT-5“还好”

OpenAI CEO Sam Altman在AI技术潜力和局限性方面发表了矛盾的言论,包括大肆宣传像GPT-5这样的技术进步,同时又在管理公众情绪方面保持克制,这反映了在激发热情和管理公众情绪之间的战略平衡,但也引发了关于AI技术...

Read More
2024-02-01 talkingdev

苹果继续推进AI驱动的Siri和Messages功能

苹果正在为iOS 18准备重大的人工智能功能。它正在使用OpenAI的ChatGPT API进行内部测试,以开发自己的AI模型。iOS 17.4的第一个测试版揭示了一个新的SiriSummarization框架,它将AI集成到Messages应用程序中,实现了...

Read More
2024-02-01 talkingdev

ChatGPT技术面试作弊有多简单?我们进行了一项实验

在技术面试中,ChatGPT可以帮助人们。一项关于该工具能够帮助多少以及作弊有多容易的实验揭示了公司立即需要改变他们所问的面试问题的紧迫性。在研究中,被面试者能够欺骗专业面试官而通过面试,而面试官却没有怀疑...

Read More
2024-02-01 talkingdev

Mistral CEO确认新的开源AI模型泄露,接近GPT-4的性能

本周,Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露,该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道,该模型在EQ-Bench上超过了全球所有其他LLM模型,仅次于GPT-4。Mistra...

Read More
2024-01-31 talkingdev

SliceGPT:新一代模型压缩工具问世

近日,一款名为SliceGPT的新一代模型压缩工具问世。据悉,该工具可以适用于从Phi-2等小型模型到大型模型的多种规模,并可对模型的权重矩阵进行剪枝处理,最大程度保持模型质量的同时,实现模型参数的大幅度减少,以...

Read More
2024-01-31 talkingdev

Meta发布CodeLlama 70B模型

Meta的新模型已经在大量代码上进行了精调和指令调整。它们在HumanEval测试中表现出色,在某些方面接近于GPT-4。这些模型可在Meta许可下和HuggingFace上使用。

Read More
2024-01-31 talkingdev

ChatGPT用户现可直接在聊天中调用GPT

现在,付费的ChatGPT用户可以通过输入'@'并从列表中选择一个GPT将OpenAI的AI模型提供的第三方应用程序引入到对话中。所选的GPT将充分了解对话内容。不同的GPT可以被标记为不同的用例和需求。 OpenAI计划最终为GPT引...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page