需要一些build议来学习OCR相关技术

我正在使用tesseract OCR引擎为iPhone的OCR项目工作。 我打算写下面的模块:

  • 从iPhone相机捕捉图像
  • 对图像进行预处理以优化它,以改善OCR输出。
  • 将OCR输出分成有意义的字段。
  • 为OCR引擎定义一些规则,以忽略任何未定义的字符。 (例如,如果OCR输出是0226s5242我希望它忽略s字符)

我想开始学习有关这些模块的主题,我不知道OCR相关的技术,所以任何意见将是非常有益的,谢谢。

然后开始编译iphone的tesseract。

这个链接可能会帮助你。

也请尝试下面的问题:

如何交叉编译iphone的tesseract ocr引擎?

然后尝试一些OCR演示: 在这里尝试

而在SOFsearch,很多相关的链接在这里:

在iphone中实现tesseract OCR

iPhone:如何使用Tesseract

Iphone的Tesseract例子

等等是其中的一些..