7段显示OCR

我正在使用Tesseract(一个OCR库)构build一个iOS应用程序(拍摄照片并运行OCR),并且使用正确的数字和字符(使用常用的字体)可以很好地工作。

我遇到的问题是,如果我在7段显示器上尝试,它会给出非常糟糕的结果。

所以我的问题是:有谁知道我可以如何解决这个问题? Tesseract是否有办法识别这些字符?

我也很难获取从LCD显示器的图像识别数字tesseract。

我用ImageMagick对图像进行了预处理,使其略微垂直移动以覆盖图像的副本,从而填补了各部分之间的空白:

$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png 

但最终,我的优点是“ 七段光学字符识别 ”二进制: http : //www.unix-ag.uni-kl.de/~auerswal/ssocr/

非常感谢作者Erik Auerswald为这个代码!

我还没有尝试OCRing 7段显示,但我怀疑这个问题可能是由不连接组件的字符造成的。 Tesseract不能很好地处理我的经验中断开的字体。

简单的侵蚀(图像预处理)可能通过连接段来帮助,但是您必须testing它并使用内核大小来防止太多的失真。

Interesting Posts