几款开源的OCR识别项目，收藏备用

随着科技的发展，OCR场景随处可见，很多APP也集成如身份证识别，银行卡识别的功能，包括微信都支持截图文件中的文字提取。现在，各大厂商均有提供各种场景的OCR识别的API。但是，有时候我们也想自己来折腾一下。这时候，就可以借助一些主流开源框架来快速达到我们的目的。

OCR引擎

tesseract

Tesseract，一款由HP实验室开发由Google维护的开源OCR引擎，开源，免费，支持多语言，多平台;

https://github.com/tesseract-ocr/tesseract.git

tesseract.js

js版本的Tesseract OCR,支持一百多种语言,使用也是非常简单，可以用npm安装，也可以直接在页面引用js

https://github.com/naptha/tesseract.js.git

PaddleOCR

PaddleOCR是百度开源一套OCR,旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。

https://github.com/PaddlePaddle/PaddleOCR.git

EasyOCR

EasyOCR是用Python编写基于Tesseract的OCR识别库，用于图像识别输出文本，目前支持80多种语言。

https://github.com/JaidedAI/EasyOCR.git

mmocr

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱，专注于文本检测，文本识别以及相应的下游任务，如关键信息提取。

https://github.com/open-mmlab/mmocr.git

simple-ocr-opencv

基于opencv 和numpy开源的OCR识别引擎

https://github.com/goncalopp/simple-ocr-opencv.git

OCR工具

OCRmyPDF

OCRmyPDF是基于tesseract-ocr开发、训练的文字识别提取的开源项目

https://github.com/ocrmypdf/OCRmyPDF.git

Umi-OCR

基于 PaddleOCR 实现的一款开源的文字识别工具，

一般开源项目，识别率肯定没有商用的那么高，只有通过训练自己的字库来提高识别率。文字识别场景，有时候就会涉及到图片处理，这里又会关联到其它强大的图像处理开源项目，如：OpenCV。这些项目中，PaddleOCR相对来说会更符合我们常见的业务场景，也支持我们自己去训练。

展开阅读全文

页面更新：2024-03-07

标签：识别率目的项目字库场景文本语言文字引擎收藏工具

1 2 3 4 5

几款开源的OCR识别项目，收藏备用

OCR引擎

tesseract

tesseract.js

PaddleOCR

EasyOCR

mmocr

simple-ocr-opencv

OCR工具

OCRmyPDF

Umi-OCR

#中美科技战# 不敌TikTok Facebook所有者Meta将裁员1万人

今年315曝光手机app窃听用户隐私，如何管理手机app权限你知道吗

截至目前，盘点支持高频PWM调光的荣耀手机，共28款

隆基绿能,阳光电源,通威股份,光伏三强，下跌结束了吗？

须知!中国新能源品牌质量排行公布:比亚迪第三，极氪、特斯拉上榜

第四次技术革命已经开始

10大最佳开源或免费项目进度管理软件盘点

陪跑40多年，中国数据库终于迎来黄金时代

9辆自动驾驶清扫车在上海嘉定测试，可替代25名环卫工人

当人工智能的“老师”很难也很酷

全省首台！在赣州正式启用！

作为全球第二数据大国，数据合规如何赋能数字经济？政协委员张毅这样建议

Office全家桶引入GPT-4，微软：辅助用户而非取代用户

雷军真的很“猛”：索尼IMX766+5000mAh，256GB存储跌至1529元

货拉拉会成为下一个快狗打车吗…

10大最佳开源或免费项目进度管理软件盘点

签约82个项目，总投资668亿元！玉林掀起招商引资“春季攻

浙能在疆5个新能源项目全面复工挖掘“风光”向大西北

共享wifi项目哪个公司好？推荐颠覆传统模式的微火共享Wi

新疆库车市举行2023年一季度重大项目开（复）工仪式

随州高新投：今年建41个项目.投资53.4亿！惠民顶呱呱

郑州春日遛娃地大合集分享，便宜又好玩的地方，赶紧收藏！

云从科技再登人民日报天府新区项目成标杆

中交地产拟按合作比例调用项目公司富余资金不超3.69亿

一位顶尖操盘手直言：出现涨停后的巨量走势，十分危险，值得