漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-01 talkingdev

Qwen MoE性能匹敌7B大模型,激活参数仅三分之一

近期,一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时,成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本,还为大规模机器学习模型的可访问...

Read More
2024-03-29 talkingdev

谷歌将Gemini Nano技术引入Pixel 8手机 提升录音与键盘智能回复功能

谷歌宣布,即将推出的Pixel 8手机将在开发者预览版中集成Gemini Nano技术。这一技术的应用旨在增强手机内置应用的功能,特别是录音器中的'Summarize'摘要功能和Gboard键盘的'Smart Reply'智能回复功能。Gemini Nano...

Read More
2024-03-29 talkingdev

1比特语言模型:后训练量化技术助力在消费级GPU上运行700亿参数模型

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...

Read More
2024-03-25 talkingdev

大数据最优传输理论:全面阅读清单开放

最优传输理论是数学和计算领域的一个丰富分支,主要研究概率分布之间的距离。此GitHub仓库提供了一个全面的阅读清单,旨在提高最优传输在速度和准确性上的扩展性。该清单包括了最优传输理论的基础知识、数学原理、算...

Read More
2024-03-12 talkingdev

黑客团队成功攻破Google AI系统获得50000美元奖金

Google最近开展了LLM bugSWAT活动,邀请黑客们在其人工智能系统中寻找安全漏洞。参赛选手Joseph “REZ0” Thacker、Justin “RHYNORATER” Gardner和Roni “LUPIN” Carta在Google的AI功能中发现了漏洞,包括利用GraphQL端...

Read More
2024-03-11 talkingdev

Sam Altman重返OpenAI董事会,调查结束

OpenAI宣布了新的董事会名单,同时结束了调查Sam Altman被撤职的事件。Sam Altman将与Dr. Sue Desmond-Hellmann、索尼前执行副总裁兼全球总法律顾问、索尼娱乐总裁Nicole Seligman、Instacart CEO和董事长Fidji Simo...

Read More
2024-02-23 talkingdev

ChartX:测试多模态语言模型理解视觉数据的可视化工具

近日,一种名为ChartX的新工具发布在GitHub上,用于测试多模态大语言模型(MLLM)在解释和推理可视化图表方面的能力。ChartX通过评估模型对图表的理解能力来测试其多模态能力,包括语言和视觉。该工具可以评估多种不...

Read More
2024-02-07 talkingdev

WhatsApp 推出跨应用安全消息传递功能,连接不同平台的用户

WhatsApp 已经致力于一项计划两年,该计划将允许其用户使用端到端加密方法在不同的消息应用之间发送消息。互操作性推出的初始阶段将使个人之间的基本功能变得可能,例如文本、图像、语音消息、视频和文件共享。预计...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page