EasyOCR-支持40多种语言的即用型OCR python库
EasyOCR是用于从图像提取文本的python模块。它是一种通用的OCR,可以读取自然场景文本和文档中的密集文本。我们目前支持70多种语言并正在扩展。
支持的语言
我们目前支持40多种语言,请参阅支持的语言列表。
安装
安装使用pip以获得稳定的版本:
pip install easyocr
您还可以通过网盘下载easyocr的源代码文件手动安装。
注意1:对于Windows,请按照https://pytorch.org上的官方说明先安装Torch和Torchvision 。在pytorch网站上,请确保选择正确的CUDA版本。如果仅打算在CPU模式下运行,请选择CUDA = None。
注意2:我们还在这里提供Dockerfile 。
用法
import easyocr reader = easyocr.Reader(['ch_sim','en']) # need to run only once to load model into memory result = reader.readtext('chinese.jpg')
输出将采用列表格式,每个项目分别表示边界框,文本和置信度。
注意1:['ch_sim','en']是您要阅读的语言列表。您可以一次传递几种语言,但并非所有语言都可以一起使用。英语与每种语言兼容。共享公共字符的语言通常相互兼容。
注意2:除了filepath chinese.jpg,您还可以将OpenCV图像对象(numpy数组)或图像文件作为字节传递。原始图像的URL也可以接受。
注3:该行reader = easyocr.Reader(['ch_sim','en'])用于将模型加载到内存中。这需要一些时间,但只需要运行一次。
您也可以将detail= 0设置为更简单的输出。
reader.readtext('chinese.jpg', detail = 0)
结果:
['愚园路', '西', '东', '315', '309', 'Yuyuan Rd.', 'W', 'E']
示例
赞 (0)