7段显示OCR

我正在使用Tesseract（一个OCR库）构build一个iOS应用程序（拍摄照片并运行OCR），并且使用正确的数字和字符（使用常用的字体）可以很好地工作。

我遇到的问题是，如果我在7段显示器上尝试，它会给出非常糟糕的结果。

所以我的问题是：有谁知道我可以如何解决这个问题？ Tesseract是否有办法识别这些字符？

我也很难获取从LCD显示器的图像识别数字tesseract。

我用ImageMagick对图像进行了预处理，使其略微垂直移动以覆盖图像的副本，从而填补了各部分之间的空白：

$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png

但最终，我的优点是“ 七段光学字符识别 ”二进制： http ： //www.unix-ag.uni-kl.de/~auerswal/ssocr/

非常感谢作者Erik Auerswald为这个代码！

我还没有尝试OCRing 7段显示，但我怀疑这个问题可能是由不连接组件的字符造成的。 Tesseract不能很好地处理我的经验中断开的字体。

简单的侵蚀（图像预处理）可能通过连接段来帮助，但是您必须testing它并使用内核大小来防止太多的失真。