漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-08-09 talkingdev

LLM辅助OCR技术——使用LLM纠正Tesseract OCR的错误

近日,一项名为LLM-aided OCR的技术在OCR领域引起了极大的关注,该技术使用LLM(语言模型)来协助纠正Tesseract OCR的错误。Tesseract OCR是一种开源OCR引擎,具有高度的准确性,但仍然无法避免一些错误。LLM-aided...

Read More
2024-05-08 talkingdev

Consistency LLM:将LLMs转换为并行解码器可将推理加速3.5倍

Consistency LLM是一种新的自然语言处理模型,可以将其转换为并行解码器,从而将推理时间缩短至3.5倍。LLM模型是一种具有良好性能的模型,但推理速度较慢。该研究团队将LLM转换为并行解码器,使用了一种名为一致性训...

Read More
2024-04-30 talkingdev

Effort引擎实现Apple硅芯片上LLM模型推断的实时调整

Effort引擎为Apple硅芯片上的LLM模型推断提供了实时调整的可能,从而在速度和质量之间找到了平衡。这种方法无需重新训练,但需要转换和预计算,可以通过加载更少的权重使模型运行得更快。开发者正在寻求Swift/Metal...

Read More
2024-04-15 talkingdev

Gemma和Siglip推出VLLM,利用LAION和LLaVA数据集进行训练

Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型(VLLM),该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练,这些数据集包含了大量的图像和相关文本信息,使...

Read More
2024-03-07 talkingdev

初创公司在荒野训练LLM模型

Reka的创始人、著名GPU评论家Yi Tay在一篇博客文章中概述了他们在谷歌之外训练极强语言模型的经验。主要的挑战来自于集群和硬件的不稳定性,他们还发现软件的成熟度也是一个挑战。尽管如此,他们还是成功地训练出了...

Read More
2024-02-23 talkingdev

ChartX:测试多模态语言模型理解视觉数据的可视化工具

近日,一种名为ChartX的新工具发布在GitHub上,用于测试多模态大语言模型(MLLM)在解释和推理可视化图表方面的能力。ChartX通过评估模型对图表的理解能力来测试其多模态能力,包括语言和视觉。该工具可以评估多种不...

Read More
2024-02-13 talkingdev

Llmware:统一LLM应用程序开发框架

Llmware是一个统一的框架,用于开发基于LLM的应用程序模式,包括检索增强生成。它提供了一个通用的API,使得开发人员能够轻松地使用不同的LLM模型和数据集。Llmware还为开发人员提供了一组可自定义的工具,用于自动...

Read More
2024-02-06 talkingdev

优秀演员还是一般演员:利用LLM检测假新闻

研究表明,经过调整的BERT模型在检测假新闻方面比通用的LLM模型(如GPT-3.5-turbo)更有效。BERT模型是一种预训练的自然语言处理模型,可用于各种文本任务。由于假新闻的传播日益严重,利用AI技术检测假新闻变得越来...

Read More
2024-02-01 talkingdev

Mistral CEO确认新的开源AI模型泄露,接近GPT-4的性能

本周,Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露,该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道,该模型在EQ-Bench上超过了全球所有其他LLM模型,仅次于GPT-4。Mistra...

Read More
2023-12-26 talkingdev

苹果公司新开源机器学习模型Ferret,可实现图像中任意粒度的元素识别和查询

苹果公司和康奈尔大学的研究人员于10月份发布了一个名为Ferret的开源多模态LLM模型。Ferret是一个系统,可以在图像中的任何位置引用和定位任何东西,并以任何粒度进行查询。该模型可以检查图像上绘制的区域,确定其...

Read More
  1. Next Page