Tesseract OCR相机

我在我的iOS应用程序中使用了Tesseract OCR 3.01,当我从手机库中select一个图像时,它显示了90%的准确性。 但是,如果我使用相机的相同图像,它显示混乱的字母。 我遵循这个教程 ,请引导我,如果可以做一些事情,以确保它从相机工作,因为它适用于画廊图像。

几乎可以肯定的问题是“定位”。 苹果倾向于以一个位图的forms创build图像 – 图像位的布局就好像相机在音量button的右侧和右侧一样。 您看到的高于宽度的图像仍按上述方式布置,但图像中包含的EXIF对象中存在“方向”。

我猜测tesseract并不看EXIF,而是期望图像处于“标准”格式,以便文本处于阅读文本的位置。

您可以使用右上angular的音量button拍摄的相机图像来testing我的假设。

如果他们工作,那么你将需要做的是自己处理图像,并重新排列每个方向设置的位。 这并不是所有难以做到的事情,但是需要您阅读vImage和/或位图上下文。

是的,有三件事情需要具体说明,首先,OCR和黑白图片很好地匹配,而不是有色的,所以如果你能把图片转换成黑白,就会提高准确率。

第二件事是尺寸和方向,你需要强制图像的尺寸是640 * 480或320,这样会增加识别的速度和准确性。对于定位,有很多方法来pipe理。

最后,如果某些方法可以允许用户精确地指定他想要执行OCR的图像的哪一部分或哪部分,这将大大提高准确性和时间,因为图书馆不需要检查整个图像的文本,而是您已经指定了要search的部分。

PS:过去几周我一直在创build一个OCR应用程序。