Tesseract改进和图像预处理步骤

我正在Tesseract库上工作,下面是Tesseract的input,

在这里输入图像说明

在实施的第一步,我只使用了身份证的“机读区”区。 但实际意图是扫描整个文件,并获得身份证的所有文本。

我已经通过这个文件并提高Tesseract的质量第一步是图像应该是300 dpi。

1)如何将拍摄的摄像头图像转换为300dpi?

2)Tesseract最好的对比度和亮度级别应该是什么?

3)是否有任何其他预处理步骤可以应用于图像以获得高精度?

4)为了更好的精确度,推荐的图像分辨率是多less?

5)我已经使用"int tesseract::TESSDLL_API::MeanTextConf"来获得信心评分。 有了这个每个angular色的信心得分,我有可能决定信心得分是否高于某个百分比,那么认可的angular色是准确的? 如果我错了,请你解释一下“MeanTextConf”方法的用法吗?

我写了几个通用的OCR博客文章在图像预处理和“OCR如何最好”的前一段时间。 请在这里find它们: http : //www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

一般来说,获得足够高的分辨率应该是第一步。 低分辨率根本没有足够的每个字母的信息来可靠地阅读字符。 然后我做自适应二值化,在这里图像被转换成黑白使用阈值的背景应该药房和字符应该保持相当清晰,没有额外的噪音或漏洞。 然后,可选地,可以对各个字段进行分割,并且对每个字段分别进行特定的设置,例如数字的“仅数字”,以及性别字段的“M | F”等。