漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-03 talkingdev

论文:随机颜色擦除提升计算机视觉模型鲁棒性

研究人员开发了一种名为随机颜色擦除的新学习策略,旨在解决计算机视觉中的颜色偏差问题。该方法通过从训练数据中选择性地移除颜色信息,平衡颜色与其他特征的重要性,从而提高模型在复杂场景中的表现,如广域监控和...

Read More
2024-06-03 talkingdev

Mozilla开发浏览器内运行的图片自动生成Alt文本模型

Mozilla公司最近成功训练了一款可以在浏览器内运行,并自动为网页图片生成替代文本(Alt文本)的模型。这一创新技术旨在提高网页的无障碍性,使视力障碍用户能够更好地理解网页内容。通过在本地运行模型,Mozilla不...

Read More
2024-05-24 talkingdev

SirLLM:增强大模型长期记忆的方法开源

近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...

Read More
2024-05-24 talkingdev

苹果计划2026年推出可折叠MacBook,配备18.8至20英寸显示屏

苹果公司正在研发一款配备折叠显示屏的MacBook,预示着可折叠技术在笔记本电脑领域的新突破。此前有传言称,苹果可能选择一款20英寸的显示屏,但最新报道显示,公司同样在考虑18.8英寸的面板选项。当这款设备闭合时...

Read More
2024-05-22 talkingdev

Braindump-构建AI游戏工具的初步探索与实践

Braindump是一款革命性的AI工具,它允许开发者通过简单的文本提示来构建俯视视角/2.5D游戏或交互式虚拟世界。这项技术可以自动生成3D模型、游戏数据和脚本,从而将用户的创意构想转化为生动的游戏内容。本文总结了Br...

Read More
2024-04-30 talkingdev

Whisper-cli:可本地部署的开源语音识别系统

近日,Ruff的开发团队发布了一款名为Whisper cpp cli的全新语音识别系统,该系统已在GitHub Repo上开源。这是一款完全自主研发的语音转文字系统,基于Whisper技术构建。Ruff团队一直以创新技术和高品质服务闻名于业...

Read More
2024-04-29 talkingdev

用Llama 3在本地完全运行 AI 小镇

AI 小镇是一个可以在本地完全运行的人类交互模拟器。这一技术的关键在于,它可以能在本地运行,而不需要依赖云端服务。用户可以在自己的计算机上模拟出人类的各种互动行为。这一创新技术的出现,为人工智能的发展提...

Read More
2024-04-28 talkingdev

论文:利用图神经网络预测器优化神经架构搜索

在神经架构搜索(NAS)的创新工作中,引入了一种图神经网络(GNN)预测器,这种预测器可以提高识别特定任务的最优神经网络配置的效率。GNN预测器通过理解神经网络的图结构,从而可以更有效地预测神经网络的性能,这...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page