如何使用Tesseract OCR读取身份证中的单词。

我正在使用Tesseract Library从身份证信息中读取信息。我得到了每个单词或每行的置信度。

图片链接

Box[0]: x=13, y=12, w=1134, h=57, confidence: 40, text: REPUYBLIQUE FRANCAISE Box[1]: x=21, y=75, w=1119, h=50, confidence: 42, text: 7 NN99 3W F 59W Box[2]: x=17, y=137, w=539, h=52, confidence: 30, text: V7 7 D5 NOM1BOHEL Box[3]: x=6, y=189, w=954, h=46, confidence: 0, text: Box[4]: x=12, y=239, w=1016, h=34, confidence: 40, text: 5 Q HV2 H CHRISTIANL NICBLE HBNIOIJE Box[5]: x=21, y=310, w=975, h=53, confidence: 67, text: 2 E 20 06 1329 Box[6]: x=28, y=372, w=1043, h=83, confidence: 0, text: Box[7]: x=11, y=397, w=1147, h=67, confidence: 0, text: Box[8]: x=251, y=461, w=837, h=46, confidence: 0, text: Box[9]: x=157, y=475, w=1019, h=105, confidence: 0, text: Box[10]: x=59, y=648, w=1045, h=32, confidence: 81, text: IDFRADOUEL<<<<<<<<<<<<<<<<<<<<932013 Box[11]: x=57, y=722, w=1047, h=34, confidence: 76, text: 0506932020438CHRISTIANE<<NI2906209F3

这是使用的代码。

 Pix *image = pixRead("/usr/src/tesseract-3.02/phototest.tif"); tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI(); api->Init(NULL, "eng"); api->SetImage(image); Boxa* boxes = api->GetComponentImages(tesseract::RIL_TEXTLINE, true, NULL, NULL); printf("Found %d textline image components.\n", boxes->n); for (int i = 0; i n; i++) { BOX* box = boxaGetBox(boxes, i, L_CLONE); api->SetRectangle(box->x, box->y, box->w, box->h); char* ocrResult = api->GetUTF8Text(); int conf = api->MeanTextConf(); fprintf(stdout, "Box[%d]: x=%d, y=%d, w=%d, h=%d, confidence: %d, text: %s", i, box->x, box->y, box->w, box->h, conf, ocrResult); }

现在我需要读取身份证中的所有单词。但是我将值tesseract :: RIL_TEXTLINE设置为tesseract :: RIL_WORD并运行代码。即使在图像中没有文字，我也有很高的信心。

图像链接

1.用于从身份证中读取信息的置信度得分。

1.什么是tesseract OCR返回的实际信心分数。？

尝试在Init调用中添加法语。

如何使用Tesseract OCR读取身份证中的单词。

UIButton重复按下

再见一个心爱的失败的副业，或者，刺中一个僵尸，我学到了什么

常见的iPhone错误。适用于质量检查人员和iOS开发人员的有效指南。第1部分

iOS 2018系列：破解iOS采访或成为iOS专家（7）

显示时，MBProgressHUD阻止与uiscrollview的交互

在主窗口上创建新的UIWindow

对于同一个新对象，Firebase FEventTypeChildAddedcallback被多次调用

如何完成两个UIViews之间的“90％幻灯片”

UIVollectionView与UIViewController作为数据源

嘿Siri：在iOS上与Anghami交谈

如何使用Tesseract OCR读取身份证中的单词。

UIButton重复按下

再见一个心爱的失败的副业，或者，刺中一个僵尸，我学到了什么

常见的iPhone错误。 适用于质量检查人员和iOS开发人员的有效指南。 第1部分

iOS 2018系列：破解iOS采访或成为iOS专家（7）

显示时，MBProgressHUD阻止与uiscrollview的交互

在主窗口上创建新的UIWindow

对于同一个新对象，Firebase FEventTypeChildAddedcallback被多次调用

如何完成两个UIViews之间的“90％幻灯片”

UIVollectionView与UIViewController作为数据源

嘿Siri：在iOS上与Anghami交谈

常见的iPhone错误。适用于质量检查人员和iOS开发人员的有效指南。第1部分