漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-28 talkingdev

微软开源BitBLAS:优化1.58位网络内核

微软近日发布了一组用于训练BitNet风格模型的GPU加速内核。这些模型在准确度上没有明显下降的情况下,大大降低了内存消耗。BitNet风格模型是一种新型的深度学习模型,它的特点是使用1.58位的数据表示方法,比传统的3...

Read More
2024-04-28 talkingdev

使用Unsloth微调Llama3:显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...

Read More
2024-04-28 talkingdev

为何可靠的人工智能需要一次范式转变

人工智能模型生成的错觉现象,即AI模型产生看似合理但实际错误的输出,为我们带来了巨大的挑战,当前的技术无法完全解决这个问题。这些问题源于生成型人工智能的基本设计,它依赖于识别数据中的模式,但缺乏对真实的...

Read More
2024-04-28 talkingdev

WRV2开源,利用冗余感知技术进行视频修复

研究人员已经引入了一种新颖的数据集和方法,用于改善视频中的线条移除问题,这是电影和电视节目中常见的视觉效果挑战。他们设计的冗余感知技术能够通过分析视频中的多余信息,找出重复的模式和结构,从而实现更精准...

Read More
2024-04-28 talkingdev

重塑旅行者1号:NASA的星际探测器重新获得通讯能力

经过五个月的远程故障排除,工程师们部分地恢复了NASA旅行者1号航天器上1970年代的计算机。旅行者1号正在以超过150亿英里的距离离开地球,因此工程师上传一个指令并获得响应几乎需要两天的时间。该航天器在去年11月...

Read More
2024-04-27 talkingdev

如何像大公司一样进行数据爬取

数据爬取是当今数据驱动型公司的重要组成部分。但是,数据爬取也可能涉及到违反网站条款和条件的行为,对公司造成法律和商业风险。因此,了解如何像大公司一样进行数据爬取是至关重要的。在进行数据爬取之前,您应该...

Read More
2024-04-27 talkingdev

论文:WCPS-适应变化的预测模型,加权CPS的应用

加权CPS(WCPS)是符合预测系统的一个扩展,专门用于适应数据环境的变化,特别是协变量的转变。协变量在统计学中是一种可以影响到研究结果的外部变量,而WCPS通过自适应调整,能更好地应对这种变化。这种扩展方法在...

Read More
2024-04-27 talkingdev

CFExplainer工具,图神经网络助力安全漏洞检测

近日,一款名为CFExplainer的新工具引起了行业的广泛关注。该工具主要是用于提升AI模型,特别是图神经网络在理解和识别软件安全漏洞方面的能力。图神经网络的出现,让我们能够更加有效地处理和分析结构化数据,尤其...

Read More
  1. Prev Page
  2. 47
  3. 48
  4. 49
  5. Next Page