社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

轻松识别文字,这款Python OCR库支持超过80种语言

Python程序员 • 5 年前 • 534 次点击  


OCR是什么?

有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。

所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。

OCR的全称叫作“Optical Character Recognition”,即光学字符识别。

这算是生活里最常见、最有用的AI应用技术之一。

细心观察便可发现,身边到处都是OCR的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。

OCR本质是图像识别,其包含两大关键技术:文本检测和文字识别。

先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。

关于EasyOCR

Python中有一个不错的OCR库-EasyOCR,在GitHub已有9700star。它可以在python中调用,用来识别图像中的文字,并输出为文本。

https://github.com/JaidedAI/EasyOCR

EasyOCR支持超过80种语言的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,未来会支持更多的语言。

安装EasyOCR

安装过程比较简单,使用pip或者conda安装。

pip install easyocr

如果用的PyPl源,安装起来可能会耽误些时间,建议大家用清华源安装,几十秒就能安装好。

使用方法

EasyOCR的用法非常简单,分为三步:

  • 1.创建识别对象;
  • 2.读取并识别图像;
  • 3.导出文本。

我们先来举个简单的例子。

找一张路标图片,保存到电脑:

接着撸代码:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en']) 
# 读取图像
result = reader.readtext('test.jpg')
# 结果
result

输出结果:

可以看到路标上的三个路名以及拼音都识别出来了!

识别的结果包含在元组里,元组由三部分组成:边框坐标、文本、识别概率。

「关于语言:」

这段代码有一段参数['ch_sim','en'],这是要识别的语言列表,因为路牌里有中文和英文,所以列表里添加了ch_sim(简体中文)、en(英文)。

可以一次传递多种语言,但并非所有语言都可以一起使用。英语与每种语言兼容,共享公共字符的语言通常相互兼容。

前文我们给出了EasyOCR支持的语言列表,并附有参数代号。

「关于图像文件:」

上面传入了相对路径'test.jpg',还可以传递OpenCV图像对象(numpy数组)、图像字节文件、图像URL。

再读取一张文字较多的新闻稿图片:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en']) 
# 读取图像
result = reader.readtext('test1.jpg')
# 结果
result

识别文字的准确率还是很高的,接下来对文字部分进行抽取。

for i in result:
    word = i[1]
    print(word)

输出:

小结

该开源库是作者研究了几篇论文,复现出来的成果,真是一位实干家。

检测部分使用了CRAFT算法,识别模型为CRNN,它由3个主要组件组成:特征提取,序列标记(LSTM)和解码(CTC)。整个深度学习过程基于Pytorch实现。

作者一直在完善EasyOCR,后续计划一方面扩展支持更多的语言,争取覆盖全球80%~90%的人口;另一方面支持手写识别,并提高处理速度。





介绍一本非常经典的入门PDF,它讲解的是程序员必知的硬核基础知识,看完能让你对计算机有一个基础的了解和入门,是培养你 内核 的基础,我们看下目录大纲

现在这本 PDF 免费分享给你,你可以扫描下方二维码回复 os 来领取这本 PDF。

▲长按二维码进行关注▲

回复「os,获取PDF



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/106099