## PaddleOCR 登顶 GitHub:超越 Tesseract,成为最受欢迎的 OCR 开源项目
据 [1M AI News](https://t.me/OneMillion_AI) 监测,百度飞桨开源 OCR 工具库 **PaddleOCR** 以 **73,300 个 GitHub 星标**,正式超越谷歌维护的经典 OCR 引擎 **Tesseract**(**73,200 星标**),登上 GitHub 星标最高 OCR 项目的位置。
目前,排名第三的 **MinerU** 星标数为 **57,500**。
—
## 从开源到领跑,PaddleOCR 持续刷新行业认知
自 **2020 年开源**以来,PaddleOCR 持续快速迭代,现已支持 **100+ 种语言**,覆盖 **160+ 个国家和地区**,在全球 OCR 开发者与企业用户中获得了广泛认可。
—
## 近期更新密集,性能表现尤为亮眼
PaddleOCR 最近动作频频,接连带来重磅升级:
– **PP-OCRv5**:仅用 **500 万参数**,便在标准 OCR 基准测试中实现了可与**十亿参数级视觉语言大模型**相媲美的识别精度。
– **PaddleOCR-VL-1.5**:在文档解析基准 **OmniDocBench v1.5** 上取得 **94.5% 准确率**,刷新该榜单纪录。
—
## 开源 OCR 竞争格局正在被改写
从星标数据到技术表现,PaddleOCR 正在用更轻量、更高效、更多语言支持的能力,重塑开源 OCR 领域的竞争格局。
在 Tesseract 长期占据行业代表地位之后,PaddleOCR 的超越,无疑成为 OCR 开源生态中的一个重要里程碑。
原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/164704/


