漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-03 talkingdev

工业领域OCR数据集发布,涵盖2600万页高质量PDF文档

近日,一个庞大的工业文档OCR数据集正式发布,该数据集包含了2600万页的高质量PDF文档,总计约180亿个标记。这些文档涵盖了工业领域的广泛内容,包括机械设计、电气工程、自动化控制等多个方面。该数据集的发布,将...

Read More
2023-10-26 talkingdev

论文:Adobe Research推出结构化文档检索工具,解决PDF文档检索难题

Adobe Research推出了一款工具,可以通过结构或文本条件来检索结构化文本文档,这项技术在文档为PDF格式时变得更加困难。此外,Adobe Research还发布了一个基准数据集供进一步研究使用。

Read More
2023-08-03 talkingdev

BrainyPDF:基于ChatGPT的PDF智能处理工具

BrainyPDF,一款全新的PDF处理工具,已正式上市。这款产品的最大亮点是,它利用了ChatGPT技术,可以对PDF文件进行智能化处理。用户只需简单操作,便可以利用ChatGPT技术对PDF文档进行概括和提问。这项技术可以快速理...

Read More