×

paddleocr 训练

paddleocr 训练(在使用ocr文字识别工具的时候怎么可以提高文字的识别率呢)

admin admin 发表于2023-03-28 12:13:33 浏览34 评论0

抢沙发发表评论

本文目录

在使用ocr文字识别工具的时候怎么可以提高文字的识别率呢

提高文字识别率这个一方面和软件有关系,一方面和你的照片有关系

根据我这半年的使用经验,可以给你提供几个参考建议

1、软件的选择:我一般都是使用手机识别名片的,所以基本上用手机,我很懒,直接在appstore里面看排名的,用的最前面,你也可以试一下,很简单的。

2、平行拍摄,这个很关键,非平行拍摄会造成字体的变形,虽然说现在识别技术很高超,但是对于书写板正的印刷体识别率还是最高的,特别是那种pdf截图的,完全平行,所以在使用OCR的时候尽量保证平行拍摄是有道理的,就像下面的这个图一样,手机和书保持平行拍摄和识别效果才会达到最好。

3、识别文件的分辨率,理所当然分辨率越高,识别率越高,举个栗子吧,比如你要识别一份菜单,如果你使用手机相机拍摄多次对焦挑选最恰当的实际拍摄出来的照片识别率要高于你随手拍的。

这个是和你的拍摄技巧有关系,多练习练习,我拍了很多名片,现在已经炉火纯青了。

人工智能深度学习具体学什么

深度学习简单的说就是利用人工神经网络去对当前已有的数据集进行训练,最后得到拟合程度很高的一个模型。

举个例子:高铁站的人脸识别机器大家都很熟悉,人脸识别就是一个典型的深度学习应用,具体原理就是用一个庞大的人脸数据库作为一个数据集,然后认为搭建好一个深层神经网络,通过将人脸数据输入到这个搭建好的深层神经网络,经过长时间的训练(有的甚至时间长达一个多月),得到一个合适的模型,在高铁站,身份证上的身份信息一旦识别到,就会读取到你的人脸图像信息,然后将这个人脸图像跟摄像头拍摄到的人脸进行匹配,一旦匹配上了就会核验通过。

当然深度学习不光是只有人脸识别,像语音识别、翻译系统、推荐系统、文字识别等都是深度学习领域范畴。

至于是否难学,要看你学到什么程度,任何一门技术都是入门容易,精通难,深度学习由于其高度不可解释性的原因,导致其入门门槛相比较于机器学习而言反而比较低。

深度学习主流的网络有卷积神经网络、循环神经网络等。

卷积神经网络通常适合于图像领域,像人脸识别、文字识别都是通过卷积神经网络完成的。循环神经网路适合做语音识别、翻译系统等。.

当然深度学习也远非如此简单,卷积神经网络下面还有很多分支,深度可分离卷积、普通卷积、分组卷积等,循环神经网络也分为LSTM、普通循环神经网络等,除此以外还有优化器、激活函数等,各种网络组合,网络横向和纵向深度如何选择、以及数据增强等等。

针对这些问题,现在也有很多比较简单,容易入门的框架,像Goole的Tensorflow,Facebook的Pytorch都是非常流程深度学习框架,国内有百度开发的PaddlePaddle框架。

如果你真的想要学习深度学习,不妨试试从数字识别做起,通过卷积神经网络做一个简单的数字识别!下面这张图就是通过卷积神经网络识别数字的实现过程!

欢迎点赞、关注我,关于深度学习理论,有什么问题可以在评论区一起了交流讨论!

什么是深度学习平台,主流深度学习平台有哪些

深度学习平台会提供深度学习框架,在框架内实现相应的深度学习算法(比如CNN、RNN等),做模型训练和预测。主要有tensorflow、paddlepaddle等,具体可以通过搜索引擎详细了解。