开启左侧

百度飞桨PaddleOCR开源库

[复制链接]
Criss 发表于 2021-9-7 19:32:15 | 显示全部楼层 |阅读模式
PaddleOCR_log.png
介绍
PaddleOCR 旨在创建多语言、出色、领先且实用的 OCR 工具,帮助用户训练更好的模型并将其应用于实践。

最近更新
  1. PaddleOCR研发团队想分享PP-OCRv2的要点,9月8日20:15,Live Address。
  2. 2021.9.7 发布 PaddleOCR v2.3,提出PP-OCRv2。PP-OCRv2 ​​的推理速度在 CPU 设备上比 PP-OCR 服务器高 220%。PP-OCRv2 ​​的 F-score 比 PP-OCR mobile 高 7%。
  3. 2021.8.3 发布PaddleOCR v2.2,新增结构化文档分析工具包,即PP-Structure,支持布局分析和表格识别(一键导出图表到Excel文件)。
  4. 2021.4.8 发布端到端文本识别算法PGNet,在AAAI 2021上发表。在这里查找教程;发布多语言识别模型,支持80多种语言识别;特别是,优化了英文识别模型的性能。
复制代码

特征
PP-OCR系列高质量预训练模型,媲美商业效果
超轻量级PP-OCRv2系列机型:检测(3.1M)+方向分类器(1.4M)+识别8.5M)=13.0M
超轻量PP-OCR手机系列机型:检测(3.0M)+方向分类器(1.4M)+识别(5.0M)=9.4M
一般PP-OCR服务器系列机型:检测(47.1M)+方向分类器(1.4M)+识别(94.9M)=143.4M
支持中英文数字识别、竖排文字识别、长文字识别
支持多国语言识别:韩语、日语、德语、法语
丰富的OCR领域相关工具包
半自动数据标注工具,即PPOCRLabel:支持快速高效的数据标注
数据合成工具,即Style-Text:轻松合成大量与目标场景图像相似的图像
支持用户自定义训练,提供丰富的预测推理部署方案
支持画中画安装,使用方便
支持Linux、Windows、MacOS等系统

可视化
test_add_91.jpg
img_01.jpg
img_02.jpg
上图是一般ppocr_server模型的可视化。

项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleOCR
Gitee: https://gitee.com/paddlepaddle/PaddleOCR

中文说明手册:https://github.com/PaddlePaddle/ ... oc_ch/quickstart.md
您也可以快速体验超轻量级OCR:在线体验

飞桨官网网址:
www.paddlepaddle.org.cn/

飞桨论坛:
http://discuss.paddlepaddle.org.cn
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表