pytesseract-谷歌 Tesseract OCR引擎包装的python库

Python-tesseract是用于python的光学字符识别(OCR)工具。也就是说,它将识别并“读取”图像中嵌入的文本。

Python-tesseract是Google Tesseract-OCR Engine的包装。它也可以用作tesseract的独立调用脚本,因为它可以读取Pillow和Leptonica图像库支持的所有图像类型,包括jpeg,png,gif,bmp,tiff等。此外,如果将Python-tesseract用作脚本,它将打印识别的文本,而不是将其写入文件。

用法

快速开始

注意:测试图像位于tests/dataGit存储库的文件夹中。

先决条件:

Python-tesseract需要Python 2.7或Python 3.6+

您将需要Python Imaging Library(PIL)(或Pillow fork)。在Debian / Ubuntu下,这是python-imaging或python3-imaging软件包。

安装Google Tesseract OCR (有关如何在Linux,Mac OSX和Windows上安装引擎的附加信息)。您必须能够将tesseract命令作为tesseract调用。如果不是这种情况(例如,因为tesseract不在您的PATH中),则必须更改“ tesseract_cmd”变量pytesseract.pytesseract.tesseract_cmd。在Debian / Ubuntu下,您可以使用软件包tesseract-ocr。对于Mac OS用户。请安装自制软件包tesseract。

注:请确保您也已安装tessconfigs并configs从正方体-OCR / tessconfigs或通过OS包管理器。

通过pip安装:pip install pytesseract

或者您也可以通过网盘下载pytesseract的源代码进行手动安装。

测试

要运行该项目的测试套件,请安装并运行tox。确保已tesseract 安装并且在PATH中。

pip install tox tox

pip install tox

(0)

相关推荐

  • 使用OpenCV和TesseractOCR进行车牌检测

    重磅干货,第一时间送达 目录 1)目的和简介 2)前言 3)使用OpenCV和Haar级联进行车牌检测 4)使用TesseractOCR识别和提取车牌号 目的与简介 当我们谈论AI时,计算机视觉绝对是 ...

  • python使用之识别验证码及相关问题

    在使用Python做自动化时候遇到登录需要识别验证码问题,此时采用pytesseract模块,遇到异常: pytesseract.pytesseract.TesseractNotFoundError: ...

  • 基于深度学习OpenCV与python进行字符识别

    重磅干货,第一时间送达 当我们在处理图像数据集时,总是会想有没有什么办法以简单的文本格式检索图像中的这些字符呢? 今天我们就一起看看有没有什么简单的办法可以实现这一功能~ 对于字符识别,我们找到了一些 ...

  • Python上使用及安装tesseract

    Python上安装及使用tesseract 用于身份证识别 前期准备 下载 pillow和pytesseract直接在 pycharm里面下载即可. 接下来 tesseract-ORT下载,点击这里下 ...

  • tesserocr-用tesseract ocr API的包装实现的字符识别python库

    tesserocr是用tesseract ocr API的包装实现的字符识别python库. tesserocr使用Cython直接与Tesseract的C ++ API集成,从而提供了简单的Pyth ...

  • 谷歌seo如何引擎优化?(谷歌seo引擎优化的7大条件)

    谷歌seo如何引擎优化?做了外贸网站的你一定也想把谷歌SEO做好,但是从哪些方面着手,可能很多人不知道,花费了高价钱做了一个外贸网站,网站On-page SEO却是烂的吓人( 还不知道On-page ...

  • EasyOCR-支持40多种语言的即用型OCR python库

    EasyOCR是用于从图像提取文本的python模块.它是一种通用的OCR,可以读取自然场景文本和文档中的密集文本.我们目前支持70多种语言并正在扩展. 支持的语言 我们目前支持40多种语言,请参阅支 ...

  • 简直让人欲罢不能!820个ML Python库,star超260万,持续周更中...

    深度学习技术前沿 120篇原创内容 公众号 当你发愁找不到合适的开源项目时,有人已经悄悄地整理好了.今天要介绍的这个 GitHub 项目提供了大量机器学习 Python 库,覆盖机器学习框架.数据可视 ...

  • 终于把所有的Python库,都整理出来啦!

    Python爱好者社区 1周前 来源:法纳斯特 大家好,我是小五

  • Python库大全,建议收藏留用!

    学Python,想必大家都是从爬虫开始的吧.毕竟网上类似的资源很丰富,开源项目也非常多. Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回车,后台会发生 ...

  • 15个好用到哭的python库,真不错!

    为什么很多人喜欢Python?对于初学者来说,这是一种简单易学的编程语言,另一个原因:大量开箱即用的第三方库,正是23万个由用户提供的软件包使得Python真正强大和流行. 在本文中,我挑选了15个最 ...

  • 10大Python库介绍!

    现在转行学编程,很多人都会选择Python,很大一部分原因是因为Python具有丰富的第三方库,既可以帮助我们提高开发效率,还能够缩减代码量.那么你知道Python有哪些库吗?这里为大家介绍10个,总 ...

  • 终于把所有的 Python 库都整理出来啦

    来源丨法纳 常用库 Chardet字符编码探测器,可以自动检测文本.网页.xml的编码. colorama主要用来给文本添加各种颜色,并且非常简单易用. Prettytable主要用于在终端或浏览器端 ...