GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

English | 简体中文

简介

PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库，助力开发者训练出更好的模型，并应用落地。

🚀 社区

PaddleOCR 由 PMC 监督。Issues 和 PRs 将在尽力的基础上进行审查。欲了解 PaddlePaddle 社区的完整概况，请访问 community。

⚠️注意：Issues模块仅用来报告程序🐞Bug，其余提问请移步Discussions模块提问。如所提Issue不是Bug，会被移到Discussions模块，敬请谅解。

📣 近期更新(more)

🔥🔥《PaddleX文档信息个性化抽取新升级》，PP-ChatOCRv3创新性提供了基于数据融合技术的OCR模型二次开发功能，具备更强的模型微调能力。百万级高质量通用OCR文本识别数据，按特定比例自动融入垂类模型训练数据，破解产业垂类模型训练导致通用文本识别能力减弱难题。适用自动化办公、金融风控、医疗健康、教育出版、法律党政等产业实际场景。10月10日（周四）19：00直播为您详细解读数据融合技术以及如何利用提示词工程实现更好的信息抽取效果。报名链接
🔥2024.10.1 添加OCR领域一站式全流程开发能力:
- 飞桨一站式全流程开发工具PaddleX，依托于PaddleOCR的先进技术，支持了OCR领域的一站式全流程开发能力：
  - 🎨 模型丰富一键调用：将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的17个模型整合为5条模型产线，通过极简的Python API一键调用，快速体验模型效果。此外，同一套API，也支持图像分类、目标检测、图像分割、时序预测等共计200+模型，形成20+单功能模块，方便开发者进行模型组合使用。
  - 🚀提高效率降低门槛：提供基于统一命令和图形界面两种方式，实现模型简洁高效的使用、组合与定制。支持高性能部署、服务化部署和端侧部署等多种部署方式。此外，对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等，进行模型开发时，都可以无缝切换。
- 支持文档场景信息抽取v3(PP-ChatOCRv3)、基于RT-DETR和PicoDet的高精度版面区域检测模型、高精度表格结构识别模型SLANet_Plus、版面矫正预测模型UVDoc、公式识别模型LatexOCR、基于PP-LCNet的文档图像方向分类模型
🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案：
- 赛题一：OCR 端到端识别任务冠军方案——场景文本识别算法-SVTRv2；
- 赛题二：通用表格识别任务冠军方案——表格识别算法-SLANet-LCNetV2。

🌟 特性

支持多种 OCR 相关前沿算法，在此基础上打造产业级特色模型PP-、PP-Structure和PP-ChatOCR，并打通数据生产、模型训练、压缩、预测部署全流程。

⚡ 快速开始

🔥 一站式全流程开发

📝 文档

完整文档请移步：docs

📚《动手学 OCR》电子书

《动手学 OCR》电子书

🎖 贡献者

⭐️ Star

许可证书

本项目的发布受 Apache License Version 2.0 许可认证。

Name		Name	Last commit message	Last commit date
Latest commit History 6,293 Commits
.github		.github
applications		applications
benchmark		benchmark
configs		configs
deploy		deploy
doc		doc
docs		docs
overrides/partials		overrides/partials
ppocr		ppocr
ppstructure		ppstructure
test_tipc		test_tipc
tests		tests
tools		tools
.clang_format.hook		.clang_format.hook
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.style.yapf		.style.yapf
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
README_en.md		README_en.md
__init__.py		__init__.py
mkdocs.yml		mkdocs.yml
paddleocr.py		paddleocr.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py
train.sh		train.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

简介

🚀 社区

📣 近期更新(more)

🌟 特性

⚡ 快速开始

🔥 一站式全流程开发

📝 文档

📚《动手学 OCR》电子书

🎖 贡献者

⭐️ Star

许可证书

About

Releases 14

Used by 3.2k

Contributors 213

Languages

License

PaddlePaddle/PaddleOCR

Folders and files

Latest commit

History

Repository files navigation

简介

🚀 社区

📣 近期更新(more)

🌟 特性

⚡ 快速开始

🔥 一站式全流程开发

📝 文档

📚《动手学 OCR》电子书

🎖 贡献者

⭐️ Star

许可证书

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 14

Used by 3.2k

Contributors 213

Languages