500万参PaddleOCR登顶开源OCR

500万参PaddleOCR登顶开源OCR

## PaddleOCR 登顶 GitHub:超越 Tesseract,成为最受欢迎的 OCR 开源项目

据 [1M AI News](https://t.me/OneMillion_AI) 监测,百度飞桨开源 OCR 工具库 **PaddleOCR** 以 **73,300 个 GitHub 星标**,正式超越谷歌维护的经典 OCR 引擎 **Tesseract**(**73,200 星标**),登上 GitHub 星标最高 OCR 项目的位置。

目前,排名第三的 **MinerU** 星标数为 **57,500**。

## 从开源到领跑,PaddleOCR 持续刷新行业认知

自 **2020 年开源**以来,PaddleOCR 持续快速迭代,现已支持 **100+ 种语言**,覆盖 **160+ 个国家和地区**,在全球 OCR 开发者与企业用户中获得了广泛认可。

## 近期更新密集,性能表现尤为亮眼

PaddleOCR 最近动作频频,接连带来重磅升级:

– **PP-OCRv5**:仅用 **500 万参数**,便在标准 OCR 基准测试中实现了可与**十亿参数级视觉语言大模型**相媲美的识别精度。
– **PaddleOCR-VL-1.5**:在文档解析基准 **OmniDocBench v1.5** 上取得 **94.5% 准确率**,刷新该榜单纪录。

## 开源 OCR 竞争格局正在被改写

从星标数据到技术表现,PaddleOCR 正在用更轻量、更高效、更多语言支持的能力,重塑开源 OCR 领域的竞争格局。
在 Tesseract 长期占据行业代表地位之后,PaddleOCR 的超越,无疑成为 OCR 开源生态中的一个重要里程碑。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/164704/

(0)
上一篇 8小时前
下一篇 8小时前

相关推荐