介绍
PaddleOCR 旨在创建多语言、出色、领先且实用的 OCR 工具,帮助用户训练更好的模型并将其应用于实践。
最近更新
- PaddleOCR研发团队想分享PP-OCRv2的要点,9月8日20:15,Live Address。
- 2021.9.7 发布 PaddleOCR v2.3,提出PP-OCRv2。PP-OCRv2 的推理速度在 CPU 设备上比 PP-OCR 服务器高 220%。PP-OCRv2 的 F-score 比 PP-OCR mobile 高 7%。
- 2021.8.3 发布PaddleOCR v2.2,新增结构化文档分析工具包,即PP-Structure,支持布局分析和表格识别(一键导出图表到Excel文件)。
- 2021.4.8 发布端到端文本识别算法PGNet,在AAAI 2021上发表。在这里查找教程;发布多语言识别模型,支持80多种语言识别;特别是,优化了英文识别模型的性能。
复制代码
特征
PP-OCR系列高质量预训练模型,媲美商业效果
超轻量级PP-OCRv2系列机型:检测(3.1M)+方向分类器(1.4M)+识别8.5M)=13.0M
超轻量PP-OCR手机系列机型:检测(3.0M)+方向分类器(1.4M)+识别(5.0M)=9.4M
一般PP-OCR服务器系列机型:检测(47.1M)+方向分类器(1.4M)+识别(94.9M)=143.4M
支持中英文数字识别、竖排文字识别、长文字识别
支持多国语言识别:韩语、日语、德语、法语
丰富的OCR领域相关工具包
半自动数据标注工具,即PPOCRLabel:支持快速高效的数据标注
数据合成工具,即Style-Text:轻松合成大量与目标场景图像相似的图像
支持用户自定义训练,提供丰富的预测推理部署方案
支持画中画安装,使用方便
支持Linux、Windows、MacOS等系统
可视化
上图是一般ppocr_server模型的可视化。
项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleOCR
Gitee: https://gitee.com/paddlepaddle/PaddleOCR
中文说明手册:https://github.com/PaddlePaddle/ ... oc_ch/quickstart.md
您也可以快速体验超轻量级OCR:在线体验
飞桨官网网址:
www.paddlepaddle.org.cn/
飞桨论坛:
http://discuss.paddlepaddle.org.cn |