漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-15 talkingdev

OpenAI营收报告:ChatGPT服务贡献巨大

据报道,OpenAI的收入预计达到34亿美元,其中大部分来自其ChatGPT服务。ChatGPT是OpenAI的一项重要服务,它通过强大的自然语言处理技术,为各行各业提供了卓越的聊天机器人解决方案。这项服务在众多行业中得到了广泛...

Read More
2024-07-12 talkingdev

LookbackLens-解决LLM幻觉问题的最简方案

Lookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

Read More
2024-07-11 talkingdev

FlashAttention-3: 异步和低精度实现快速准确的注意力机制

近日,由香港中文大学、清华大学等机构的研究人员提出了一种新的注意力机制模型——FlashAttention-3。相较于传统的注意力机制,FlashAttention-3 实现了异步和低精度计算,从而实现了在保证准确度的同时,大幅提高了...

Read More
2024-07-03 talkingdev

论文:用Mamba进行远程感应,研究者提出新方法RSCaMa

科研人员最近引入了一种新的方法——RSCaMa,用于使用自然语言描述远程感应图像中的变化。随着科技的发展,远程感应技术在环境、农业等领域得到了广泛应用。然而,对于大量的远程感应图像数据进行解析和描述却仍然面临...

Read More
2024-06-25 talkingdev

在TRL中训练视觉模型

TRL是一个Hugging Face库,专为使用强化学习训练变形金刚设计。这个示例允许您对基于视觉的语言模型如LLaVA进行相同的处理。Hugging Face是一个开源NLP(自然语言处理)社区和公司,致力于使用人工智能推动自然语言...

Read More
2024-06-25 talkingdev

论文:PE-Rank-改进的段落排名方法

PE-Rank是一种新的段落排名方法,通过使用单一的段落嵌入来进行上下文压缩,从而提高了效率。段落排名在许多技术领域都有重要的应用,如信息检索、机器翻译和自然语言处理等。传统的段落排名方法往往需要大量的计算...

Read More
2024-06-24 talkingdev

OpenAI GPT-5推迟至2025年发布,将具备博士学位水平能力

OpenAI的下一代人工智能模型GPT-5预计将比当前的GPT-4更加智能。据透露,该模型的发布尚需至少一年半的时间。GPT-5将具备先进的记忆和推理能力,部分任务的处理智能将达到博士学位水平。OpenAI首席技术官Mira Murati...

Read More
2024-06-23 talkingdev

Llama.ttf:一种既是字体又是LLM的创新技术

Llama.ttf是一种新型字体技术,它不仅可以作为字体使用,还能充当LLM(低级语言模型)的一部分。该技术通过将LLM嵌入字体中,使得字体在呈现文本的同时,也能进行机器学习任务。这项技术的研究者表示,Llama.ttf可以...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page