漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-22 talkingdev

Gemini Pro 1.5推出,视频处理成为其杀手级应用

Gemini Pro 1.5是Gemini系列的一次巨大升级。该模型具有100万令牌上下文大小,远大于Claude 2.1的20万和gpt-4-turbo的12.8万令牌上下文大小。虽然该模型仍然可能漏掉一些东西并产生错误细节,但它能够处理并提取短视...

Read More
2023-06-16 talkingdev

Easy OCR: 强大的OCR技术开源库

Easy OCR是一个强大的OCR技术开源库,能够从图像或PDF中提取文本。它已经支持了超过80种语言,并采用了一些最先进的方法。 ## Easy OCR的三大核心优势 - 支持超过80种语言,适用于全球各地的使用者。 - 采用最先进...

Read More