全能OCR识别工具,白嫖各个大厂,就是作者有点皮
https://m.toutiao.com/is/JVaEaMp/
OCR技术大家都知道,现在真的是必备的生产力神器了。想当年去网上找资料遇到图片无法复制粘贴,就只能手敲...现在有了ORC图像识别,只需一秒就能解决问题。
随着OCR市场需求的增长,像bat、搜狗、网易这些大厂都开放了OCR接口,今天分享的PandaOCR可以白嫖各个大厂的接口,免费享受高精度的图像识别!
图像识别+翻译+朗读
相较于之前用的天若OCR,熊猫OCR从功能到界面都更优秀,并且完全免费无广告。先说支持的识别方式:支持直接拖入、截图和剪贴板识别。
识别后可以勾选自动翻译和自动朗读,还能智能排版,非常便捷。快捷键F4截图识别翻译一气呵成。
再看一眼支持的引擎,基本市面上能见到的全部都有...
这里要和大家说一下,这些接口默认都是演示版,也就是各个厂家拿来给客户体验用的,所以不够稳定并且有限制。
当然如果不是重度使用,演示版基本也够用了,如果使用频率较高或者需要更稳定更精确的服务,推荐使用API版。
API版就是各个厂商拿来卖钱的商用版,但是多数厂商都会提供免费的次数,所以白嫖的机会来了。
这里拿百度的API为例,每天500次免费,个人使用完全够了,而且这是高精度版,正确率很高。
而且如果真的不够用,别忘了还有一堆其他厂商也有免费次数,我们可以换个地方接着薅羊毛。
这里依旧以百度为例,在百度AI开放平台登录,找到文字识别点击立即使用。
然后新建一个应用,选个人,信息随便填。建好后拿到APIKEY和SECRETKEY。
然后打开配置文件(右键窗口左上角图标)填上自己的APIKEY和SECRETKEY,并根据需求修改配置数字。
图 | 修改配置文件切换API版
修改完配置文件记得重启软件。其他API也是同理。
公式识别和表格识别
PandaOCR也是支持公式识别和表格识别的,先说使用频率更高的表格识别。识别引擎选表格识别,识别后右键点击下载表格直接下载到本地。
图 | 识别效果
下载的文件路径就在软件的安装目录,注意默认的表格识别接口可能会失效,记得打开配置文件切换一下试试,想要稳定直接用API版。我这里用的是阿里表格演示版。
图 | 无法识别记得修改配置文件接口
公式识别也是同理,引擎选择公式识别,可以识别出LaTeX公式源码,然后就可以转换MathML代码插入到word。
细节功能
除了基本的识别,PandaOCR还可以进行游戏机翻,识别并翻译外语游戏剧情字幕,实现实时汉化功能。
具体步骤可以看官方教程。下面介绍几个非常实用的功能。
历史记录
鼠标移动到左边面板的上半部分可以显示识别图片的历史记录,非常贴心。
图像处理
直接上传图片可以对图片进行简单处理,比如色彩增强、清晰化、增强对比、二次元化等等,还可以转换成各种风格。
还有图像抠图的接口也是非常好用,试了一下效果不错。
以图搜图也不用多介绍,熊猫里聚合了搜狗、百度、谷歌等主流的搜图入口。
还有图床功能也不多介绍了,临时的长期的都有。
语音识别
强大的功能又来了,熊猫OCR还自带语音识别功能,右键左边面板打开。点开始录音,然后可以把语音转换为文字,非常实用。