漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-03 talkingdev

工业领域OCR数据集发布,涵盖2600万页高质量PDF文档

近日,一个庞大的工业文档OCR数据集正式发布,该数据集包含了2600万页的高质量PDF文档,总计约180亿个标记。这些文档涵盖了工业领域的广泛内容,包括机械设计、电气工程、自动化控制等多个方面。该数据集的发布,将...

Read More
2024-03-05 talkingdev

OpenAI与Figure合作,让人形机器人更加智能化

不久的将来,人形机器人将会与人类制造工人一起工作。在这个领域中占据重要地位的Figure公司最近筹集了6.75亿美元,并与OpenAI达成协议,为其机器人开发下一代人工智能模型。这笔资金超过了Figure最初设定的金额150...

Read More
2024-03-04 talkingdev

论文:深度语义理解,从粗到细的潜在扩散图像合成方法

粗到细潜在扩散(CFLD)方法引入了一种新的姿势引导人像合成方法,通过对图像进行深度语义理解来避免过拟合,克服了现有模型的局限性。

Read More
2023-12-11 talkingdev

OneLLM: 一种理解八种不同模态的多模态AI

一种名为OneLLM的新型AI模型正在掀起波澜,它使用一种独特的方法将所有这些模态与语言对齐,理解包括图像、音频甚至脑活动在内的八种不同类型的数据。OneLLM的这种多模态理解方法可能会推动AI在语义理解方面的进一步...

Read More
2023-10-18 talkingdev

百度发布ERNIE 4.0,声称与OpenAI的GPT-4不相上下

百度发布了其先进的人工智能聊天机器人ERNIE 4.0,并声称它与OpenAI的GPT-4不相上下。ERNIE 4.0是一种基于深度学习的语言模型,它在理解自然语言方面取得了重大突破。ERNIE 4.0能够更好地理解人类语言,并在语义理解...

Read More
2023-09-27 talkingdev

图像编辑一致性提升:更智能理解全景和隐藏对象

目前,大多数语义图像编辑工具在将新对象平滑地融入场景中时面临困扰。这种新方法通过智能理解全景和部分隐藏的对象,改善了这一问题。语义图像编辑是一种基于图像含义进行更改的技术,其核心在于理解图像的内容并对...

Read More
2023-06-30 talkingdev

使用OpenAI、LlamaCpp和GPT-4-All,与代码库和文档的问答工具开源

近日,一款名为Talk-Codebase的新工具在GitHub上发布了。该工具利用OpenAI、LlamaCpp和GPT-4-All技术,实现了与代码库和文档进行交流的功能。通过这款工具,开发人员可以直接与代码库和文档进行对话,提问、查找信息...

Read More
2023-04-16 talkingdev

打破记录!1T参数模型将使用33TB文本数据进行训练

新闻内容: - 研究人员正在使用33TB的文本数据训练一个1T参数模型,这是迄今为止最大的模型之一。 - 这个模型将用于自然语言处理,如语义理解和机器翻译,以提高模型的准确性和语义理解能力。 - 这项工作突破了以前...

Read More