Tesseract OCR相机

我在我的iOS应用程序中使用了Tesseract OCR 3.01，当我从手机库中select一个图像时，它显示了90％的准确性。但是，如果我使用相机的相同图像，它显示混乱的字母。我遵循这个教程，请引导我，如果可以做一些事情，以确保它从相机工作，因为它适用于画廊图像。

几乎可以肯定的问题是“定位”。苹果倾向于以一个位图的forms创build图像 – 图像位的布局就好像相机在音量button的右侧和右侧一样。您看到的高于宽度的图像仍按上述方式布置，但图像中包含的EXIF对象中存在“方向”。

我猜测tesseract并不看EXIF，而是期望图像处于“标准”格式，以便文本处于阅读文本的位置。

您可以使用右上angular的音量button拍摄的相机图像来testing我的假设。

如果他们工作，那么你将需要做的是自己处理图像，并重新排列每个方向设置的位。这并不是所有难以做到的事情，但是需要您阅读vImage和/或位图上下文。

是的，有三件事情需要具体说明，首先，OCR和黑白图片很好地匹配，而不是有色的，所以如果你能把图片转换成黑白，就会提高准确率。

第二件事是尺寸和方向，你需要强制图像的尺寸是640 * 480或320，这样会增加识别的速度和准确性。对于定位，有很多方法来pipe理。

最后，如果某些方法可以允许用户精确地指定他想要执行OCR的图像的哪一部分或哪部分，这将大大提高准确性和时间，因为图书馆不需要检查整个图像的文本，而是您已经指定了要search的部分。

PS：过去几周我一直在创build一个OCR应用程序。