Tesseract改进和图像预处理步骤

我正在Tesseract库上工作，下面是Tesseract的input，

在这里输入图像说明

在实施的第一步，我只使用了身份证的“机读区”区。但实际意图是扫描整个文件，并获得身份证的所有文本。

我已经通过这个文件并提高Tesseract的质量第一步是图像应该是300 dpi。

1）如何将拍摄的摄像头图像转换为300dpi？

2）Tesseract最好的对比度和亮度级别应该是什么？

3）是否有任何其他预处理步骤可以应用于图像以获得高精度？

4）为了更好的精确度，推荐的图像分辨率是多less？

5）我已经使用"int tesseract::TESSDLL_API::MeanTextConf"来获得信心评分。有了这个每个angular色的信心得分，我有可能决定信心得分是否高于某个百分比，那么认可的angular色是准确的？如果我错了，请你解释一下“MeanTextConf”方法的用法吗？

我写了几个通用的OCR博客文章在图像预处理和“OCR如何最好”的前一段时间。请在这里find它们： http : //www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

一般来说，获得足够高的分辨率应该是第一步。低分辨率根本没有足够的每个字母的信息来可靠地阅读字符。然后我做自适应二值化，在这里图像被转换成黑白使用阈值的背景应该药房和字符应该保持相当清晰，没有额外的噪音或漏洞。然后，可选地，可以对各个字段进行分割，并且对每个字段分别进行特定的设置，例如数字的“仅数字”，以及性别字段的“M | F”等。

Tesseract改进和图像预处理步骤

El Capitan + Xcode 7.1不允许我允许企业签名

如何在自动布局中添加视差效果

CKFetchNotificationChangesOperation返回旧的通知

滚动UITextView到底部

ios – 动态创建和显示unicode字符串

直接从iPhone执行SQL查询到在线服务器

用写入文件失败

使用hidesBottomBarWhenPushed在推送动画期间工具栏定位错误

Xcode 5.1打破了一些testing

导航控制器显示黑屏