漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-08-09 talkingdev

LLM辅助OCR技术——使用LLM纠正Tesseract OCR的错误

近日,一项名为LLM-aided OCR的技术在OCR领域引起了极大的关注,该技术使用LLM(语言模型)来协助纠正Tesseract OCR的错误。Tesseract OCR是一种开源OCR引擎,具有高度的准确性,但仍然无法避免一些错误。LLM-aided...

Read More
2023-10-02 talkingdev

辨别真实与虚假面孔的新研究

本研究利用视觉和语言工具,提高系统识别真实与虚假面孔的能力。在当前的科技发展中,面部识别技术已经被广泛应用于众多领域,包括安全监测、社交媒体以及各类身份验证等。然而,这种技术也面临着虚假面孔的挑战,通...

Read More
2023-08-23 talkingdev

论文:专为小物体识别而设计的CFINet:提升小物体的目标检测能力

尽管现有的技术在目标检测方面已经表现出色,但在识别小物体的能力上往往存在问题。因此,专为解决这个问题而设计的CFINet应运而生。该网络采用分步骤方法,首先找到可能存在小物体的感兴趣区域,然后专注于模仿特征...

Read More